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Introduction 


L'approche de celivre est résolument pédagogique. Son objectif est de présenter clairement 
les principales méthodes économétriques et d'expliquer en détail comment les utiliser en 
pratique. Notre ouvrage se distingue par labondance des études de cas exposées, qui 
utilisent systématiquement des données réelles et qui portent aussi bien sur des problé- 
matiques d'entreprise que sur des problématiques financières ou macroéconomiques. Ce 
livre constitue donc un outil particulièrement utile à l'apprentissage de l’économétrie par 
des étudiants en sciences de gestion comme en sciences économiques. 


L'ouvrage se distingue également par la place qu’il accorde à expliquer comment les 
modèles sont spécifiés pour différents types d'applications. L'enseignement de l’éco- 
nométrie se concentre trop souvent exclusivement sur les techniques d’estimation des 
modèles, sans détailler au préalable les méthodes de spécification de ces modèles. Or, 
dans la pratique, la validité d’une étude économétrique dépend de la pertinence de 
la spécification du modèle estimé; il est vain de connaître les différentes méthodes 
d'estimation et d’inférence statistique si on les applique à des modèles incohérents. 


Toutes les données utilisées dans les exercices peuvent être téléchargées sur Le site Internet 
de l’éditeur, à l’adresse www.pearsoneducation.fr. Les applications sont réalisées à l’aide 
de différents logiciels, dont l’usage est très répandu. D’une part, pour certains exercices 
simples, nous montrons comment réaliser des calculs économétriques avec un logiciel de 
type tableur, Excel, en raison de sa popularité sur les postes de travail. D’autre part, nous 
initions le lecteur à l’utilisation de logiciels économétriques spécialisés de grande qualité : 
TSP, SPSS et Easyreg. Ceux-ci sont complémentaires : ils diffèrent dans leur mode de 
fonctionnement, ce qui donne au lecteur toutes les clés des outils informatiques — TSP est 
basé sur la programmation de séquences d’instruction tandis que SPSS et Easyreg reposent 
sur des choix de menus. Pour chacun des logiciels utilisés, le livre présente une introduction 
détaillée à son utilisation de base. De cette manière, le lecteur peut passer à une mise en 
pratique immédiatement, sans avoir à lire au préalable les notices d’utilisation fournies 
par les éditeurs. Toutefois, notre ouvrage ne prétend pas se substituer à la documentation 
officielle, dont la lecture est indispensable pour une utilisation approfondie. Précisons 
également que le choix de ces logiciels n'implique pas de jugement de valeur quant aux 
autres outils économétriques qui existent sur le marché — il n’était pas possible d’inclure 
une présentation détaillée de tous les logiciels disponibles. 


Introduction 
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Introduction 


La compréhension de l’ouvrage nécessite la connaissance de quelques notions mathéma- 
tiques de base. Au besoin, le lecteur peut se référer à l'ouvrage Mathématiques appliquées 
à la gestion de Ariane Szafarz. De la même manière, une connaissance de base de la 
théorie statistique est nécessaire. Le lecteur peut se reporter utilement au livre de Patrick 
Roger : Probabilités, statistique et processus stochastiques, publié dans la même collection. 
Les méthodes d'estimation et leurs propriétés sont présentées avec une grande rigueur 
mathématique et statistique, tout en s’efforçant d’expliquer la portée pratique des résultats 
présentés ; Le lecteur doit comprendre sous quelles conditions chaque méthode ou chaque 
test peut être utilisé à bon escient. Les preuves mathématiques des différents résultats 
et propriétés ne sont toutefois pas détaillées dans cet ouvrage, le lecteur intéressé étant 
renvoyé pour cela aux nombreux ouvrages d’économétrie théorique existants. Notre 
conviction est que l’enseignement de l’économétrie doit d’abord intéresser l'étudiant 
à la discipline en lui montrant d'emblée les applications pratiques enthousiasmantes 
qu’elle permet de réaliser. La motivation qui en résulte devrait inciter naturellement 
le lecteur à approfondir ensuite sa connaissance de l’économétrie, en s'intéressant aux 
développements mathématiques à la source des méthodes et de leurs propriétés. 


Cet ouvrage constitue le manuel idéal pour un premier cours d’économétrie, centré sur 
l'explication des méthodes et sur leur mise en pratique. Le professeur peut y ajouter lui- 
même, à sa propre convenance, les démonstrations mathématiques de certains résultats. 
Dans les programmes d’enseignement où l’on organise séparément des cours d’économé- 
trie théorique et un cours d’économétrie appliquée, notre ouvrage constitue bien sûr un 
manuel approprié à ce dernier. Ce livre peut également être utilisé en complément d’un 


manuel essentiellement théorique. 


Je tiens à remercier TSP International pour m'avoir autorisé à reproduire ici des extraits 
de résultats produits avec le logiciel TSP, Herman Bierens pour avoir permis la repro- 
duction de captures d’écran issues d’Easyreg, et SPSS France pour un accord simi- 
laire concernant SPSS. La reproduction d’éléments issus d’Excel respecte les conditions 
imposées par Microsoft Corporation, telles qu’elles étaient publiées sur la page Inter- 
net http ://www.microsoft.com/france/permission/copyrgt/cop-img.htm#ScreenShot 
en février 2004. 


Je remercie également Roland Gillet, le directeur de la collection, pour la confiance qu’il 
m'a témoignée en me proposant de rédiger ce manuel, ainsi que Pearson Education France 
pour le soin apporté à la réalisation de l'ouvrage, en particulier Pascale Pernet, Antoine 
Chéret, et tout spécialement Christophe Lenne pour son engagement, sa patience et sa 
rigueur. Leur professionnalisme permet de proposer au lecteur un produit de grande 
qualité. 


Éric Dor 
Docteur ès sciences économiques 
Directeur de la recherche 
IESEG School of Management 
Lille 
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Ce chapitre définit l'objectif et la méthode générale de 
l'économétrie. || précise quelques notions de base 
indispensables à la compréhension de l'ouvrage, liées 
à la modélisation mathématique des phénomènes 
rencontrés en sciences économiques et en sciences de 


gestion. 


El Utilité et définition 
de l’économétrie 


L'économétrie est le principal outil d’analyse quantitative utilisé 
par les économistes et gestionnaires dans divers domaines d’appli- 
cation, comme la macroéconomie, la finance ou le marketing. 
Les méthodes de l’économétrie permettent de vérifier l'existence 
de certaines relations entre des phénomènes économiques, et de 
mesurer concrètement ces relations, sur la base d'observations de 
faits réels. 


Dans son acception la plus restreinte, l’économétrie est un ensemble 
de techniques utilisant la statistique mathématique qui vérifient la 
validité empirique des relations supposées entre les phénomènes 
économiques et mesurent les paramètres de ces relations. Au sens 
large, l’économétrie est l’art de construire et d’estimer des modèles 
empiriques adéquats par rapport aux caractéristiques de la réalité, 
et intelligibles au regard de la théorie économique. 


Utilité et définition de l’économétrie 


Pi Relations économiques 


La réflexion que l’on peut mener sur une réalité économique quelconque conduit tou- 
jours à établir des relations entre les phénomènes économiques concernés. Une réflexion 
approfondie dans un domaine de science économique ou science de gestion est à la base 
de toute analyse économétrique. En d’autres termes, la réalisation de travaux économé- 
triques suppose la connaissance préalable des disciplines économiques en jeu, puisqu'elles 
suggèrent le type de relation à vérifier sur les données réelles observées. 


Exemple 


On suppose que la consommation totale des ménages augmente avec leur revenu disponible 
réel, mais diminue quand le taux d'intérêt monte. Une telle relation économique s'écrit de la 
manière suivante : 
êc fc 

c=f(ydr), avec Sy > 0 et ñ <0 (a) 
où c correspond à la consommation, yd au revenu disponible et r au taux d'intérêt. La nota- 
tion f() désigne une fonction quelconque, linéaire ou non {il faudrait poser des hypothèses 
supplémentaires pour en préciser la forme fonctionnelle, mais ce n'est pas le propos de cette 
section). La supposition de départ se formule de la façon suivante : la dérivée partielle de f par 
rapport à yd est positive — à taux d'intérêt r inchangé, une augmentation du revenu disponible 
yd implique une augmentation de la consommation c — et la dérivée partielle de f par rapport 
à r est négative — à revenu disponible inchangé, une augmentation du taux d'intérêt r implique 
une diminution de la consommation c. 


Exemple 


Une relation économique suggère que le taux d'intérêt nominal R est une fonction croissante du 
taux d'inflation INF et du taux de croissance de la production CR : 
0R 


NE 0 et TN 0 (b) 


R=fUNF,CR), avec 


El Vérification de l’adéquation empirique 
des relations 


Pour expliquer comment se détermine(nt) un ou plusieurs phénomènes économiques, 
on construit un modèle à partir de certaines hypothèses et des résultats qu’elles donnent 
dans le cadre d’une théorie particulière. On vérifie que ce modèle décrit réellement la 
manière dont le ou les concept(s) d'intérêt se détermine(nt) dans la réalité. Il faut pour 
cela disposer de mesures réelles des phénomènes (les « statistiques ») et vérifier au moyen 
de techniques issues de la statistique mathématique (1) que le modèle correspond à ces 
données observées. 


1. Si nécessaire, quelques rappels utiles de la statistique mathématique peuvent être puisés dans tout bon 
manuel de base, comme par exemple le livre de Probabilités, statistique et processus stochastiques de Patrick 
Roger, publié chez Pearson Education France dans la même collection. 
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E1 Mesure des taux de réaction 


Dans la mesure où le modèle est acceptable, on souhaite également mesurer quantitati- 
vement les taux de réaction des phénomènes expliqués aux variations des phénomènes 
explicatifs. Ces mesures permettront de simuler ultérieurement l’effet de telle ou telle 
variation hypothétique d’un phénomène explicatif sur les phénomènes expliqués. 


Soit un modèle explicatif du taux d'intérêt, sous la forme d’une équation où le taux d’infla- 
tion est une variable explicative. On vérifie son adéquation à la réalité observée. Comme 
on dispose alors des mesures des taux de réaction du taux d’intérêt à ses déterminants, 
on peut évaluer à l'avance l’effet sur le taux d’intérêt d’une accélération de l'inflation 
d’un montant déterminé. Souvent, plusieurs théories concurrentes expliquent les mêmes 
réalités économiques. Les techniques économétriques permettent d'identifier celle qui 
explique le mieux la réalité, celle qui est au plus près des observations. 


E Formes fonctionnelles et paramètres 


L'objectif est de vérifier l'adéquation d’un modèle à la réalité observée et de mesurer les 
taux de réaction des phénomènes expliqués aux phénomènes explicatifs. Pour confronter 
efficacement modèle et données, il convient d’exprimer ce dernier sous une forme « mani- 
pulable ». Selon la relation (a), la consommation est une fonction du revenu disponible et 
du taux d'intérêt. Cette formulation est mathématiquement trop « vague » pour pouvoir 
être confrontée à la réalité observée. Pour pallier le problème, il faut spécifier a priori une 
forme fonctionnelle particulière de la fonction f(). Les possibilités sont innombrables. 


5.1 CHOIX D'UNE RELATION LINÉAIRE 


Le choix le plus simple est celui d’une relation linéaire. Il se justifie quand on peut 
raisonnablement supposer que les dérivées partielles de la variable dépendante par rapport 
à chaque variable explicative ne sont pas fonction des niveaux atteints par ces variables 
explicatives. Cette hypothèse signifie que la variation de la variable dépendante, suite à 
une variation de une unité de l’une des variables explicatives, est toujours la même quels 
que soient les niveaux déjà atteints par celles-ci. 


Exemple 


On suppose que la fonction f() est linéaire. Soient les paramètres «, B et y tels que : 
c=a+fyd+yr, avec B>0 et y<0 (a') 
On a donc f(yd, r) = à + Byd + yr. On remarque que : 


dc Ôc 


ÿ= 


= — et 
p dyd : or 


Le coefficient B est donc la dérivée partielle de c par rapport à yd. Il rend compte de l'importance 
de la variation de c quand yd augmente de une unité, à r constant. Que se passeil quand r 
ne change pas, mais que yd augmente de une unité [il s'agit de l’unité dans laquelle yd est 
exprimé]? La réponse est que c varie de B unités (il s'agit ici de l'unité de mesure dans laquelle c 
est exprimé). De la même manière, y est la dérivée partielle de c par rapport à r. Il rend compte 
de l'importance de la variation (par exemple en milliards d'euros à prix constants) de c quand 
r augmente de une unité {par exemple d'un montant absolu de 1% lorsque r est exprimé en 
pourcentage), yd restant inchangé. Lorsque la relation entre les variables est supposée linéaire, 
chaque paramètre est interprété comme la dérivée partielle de la variable dépendante par 
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À 


rapport à la variable explicative concernée. Chaque paramètre mesure donc la variation de la 
variable dépendante suite à une augmentation de une unité de la variable explicative concernée, 
les autres variables explicatives restant inchangées. 


5.2 CHOIX D'UNE RELATION NON LINÉAIRE 


La linéarité est certes commode, mais n’est pas toujours une propriété adéquate à la relation 
traitée. Souvent, il est irréaliste de supposer que la variation de la variable dépendante est 
toujours la même, suite à une variation de une unité d’une variable explicative, quels que 
soient les niveaux déjà atteints par cette dernière et par les autres variables explicatives. 
On ne peut alors partir du principe que les dérivées partielles sont indépendantes des 
niveaux des variables. Dans ce cas, on travaille avec des relations formalisées sous la forme 
d'équations non linéaires. 


Exemple 


On souhaite modéliser la relation entre les ventes d’un produit de grande consommation V et 
les dépenses de publicité PUB de l'entreprise productrice. Si l'on pense que la « productivité », 
en termes de ventes, des dépenses de publicité décroît avec leur montant, on peut écrire : 


V = aPUB, avec 0O<B<I1 


Cette spécification implique en effet une dérivée première de V par rapport à PUB, qui décroît 
avec le montant de PUB. Autrement dit, au fur et à mesure que les dépenses publicitaires 
augmentent, l'augmentation des ventes devient de plus en plus faible. 


Certaines relations non linéaires sont équivalentes à des relations linéaires entre des 
transformations des variables. 


Exemple 


Si l'on transforme les variables en logarithmes, une fonction de production de Cobb-Douglas, 
du type Y = AKŸL', où Y, L et K sont la production, le travail et le capital, implique une relation 
linéaire entre les transformations des variables : 


In(Y) = In(AKBLY) et donc In(Y) = In(A) + BIn(K) + yIn(L). Elle n'implique pas toutefois la 
; : : ue A AOŸ a 0Y is 
constance des productivités marginales, qui restent bien sûr Sn AyKPLY let Re ABKŸ IL. 
Cette nouvelle équation ne constitue qu’une autre manière d'exprimer la même fonction de 
production : chacune des deux écritures implique l'autre et les propriétés économiques sont 


t t| êmes. L'écriture en logarithme met en évidence que B LR e 
exactement les mêmes. : = 
$ 1 ômKk  &KY 
- ômY : aY L 


y = = — — sont les élasticités (1) de la production aux quantités de facteurs capital et 
9 InL OL Y 


travail. Ces élasticités sont supposées constantes [indépendantes des quantités de facteurs K 
et L] dans une telle fonction de production (Cobb-Douglas). Alors que la dérivée partielle d'une 
variable x, par rapport à une variable x; mesure la variation de x: (en nombres d'unités) quand 
x augmente de une unité, l'élasticité de x1 à x2 mesure la variation de x1 (en pourcentage] quand 
x augmente de 1 %. Les coefficients B et y, qui ne sont donc pas des productivités marginales, 
sont des rapports entre productivités marginales et moyennes. La fonction de Cobb-Douglas 
implique en effet la constance de ces rapports, au sens de leur indépendance par rapport à K 
et L. 


1. Affirmer que l’élasticité de x, à x, est égale à 2 revient à affirmer la proposition suivante : lorsque x, augmente 
de 1 %, alors x augmente de 2 %. 
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: : pr À 2 2 po 3 
Cela dit, de nombreuses formes fonctionnelles non linéaires ne peuvent être linéarisées 


moyennant une transformation des variables. 


Exemple 
Soit la fonction de production CES, ayant la forme : 
Y= (KP + (RL EP) PP, 


Elle ne peut être linéarisée exactement {c'est-à-dire transformée en une relation linéaire reliant 
des transformations non linéaires séparées de chaque variable). 


Remarque 


Une erreur de spécification à éviter : la redondance 

Il est important de comprendre l'interprétation des coefficients en termes de dérivées par- 
tielles pour éviter des erreurs dans la spécification d'une relation. Une erreur très répandue 
consiste à introduire une variable explicative supplémentaire sous prétexte qu'elle affecte la 
variable dépendante par son effet sur une autre variable explicative déjà introduite. C'est le 
phénomène de la redondance! 


EH Validation empirique et types de données 
6.1 DIMENSION DU TEMPS OÙ DES AGENTS 


Une fois représentées par des formes fonctionnelles adéquates, les relations théoriques, 
c’est-à-dire le modèle, peuvent être confrontées aux données observées. Il s’agit de vérifier 
leur caractère explicatif de la réalité et de mesurer concrètement la valeur de leurs 
paramètres. Il est alors possible de calculer les taux de réaction des variables expliquées 
aux variables explicatives. Les données observées peuvent être des séries temporelles, des 
données en coupe instantanée ou des données panel. 


Séries temporelles 


Quand une équation semble décrire correctement la manière dont une variable évolue 
d’une période à l’autre, en fonction de l’évolution temporelle de certaines variables 
explicatives, elle peut être vue comme une relation stable et valable à tout moment. Ses 
coefficients ne sont pas indicés par le temps. On les suppose constants dans le temps. C’est 
une hypothèse forte, mais dans la mesure où la théorie économique a une quelconque 
validité pour expliquer les phénomènes économiques, on peut supposer l’existence de 
relations stables. Pour les vérifier empiriquement, il faut estimer leurs coefficients à partir 
des observations historiques des variables du modèle, appelées « séries temporelles » (ou 
«séries chronologiques »). 


Données en coupe instantanée 


Quand une équation semble plutôt décrire la manière dont différents agents économiques 
(entreprises, individus, régions, pays, secteurs...) déterminent la valeur particulière d’une 
variable en fonction des valeurs que prennent pour eux certaines variables explicatives, 
elle peut être vue comme une relation commune aux différents agents. Les coefficients 
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sont supposés les mêmes pour tous les agents, durant une période d’étude donnée. Pour 
vérifier cette relation, il faut la confronter à des observations concrètes des variables du 
modèle pour un ensemble d’agents différents, durant une même période. On appelle de 
telles observations des « données en coupe instantanée ». 


Données panel 


Quand une équation semble décrire la manière dont une variable varie d’une période à 
l’autre et diffère d’un agent à l’autre en fonction de l’évolution dans le temps de certaines 
variables explicatives et de leurs différences d’un agent à l’autre, elle peut être vue comme 
une relation stable et commune à tous, décrivant le comportement de tous les agents 
durant toutes les périodes. Pour mesurer et vérifier une telle relation, il faut la confronter 
à des observations des variables du modèle pour un ensemble d’agents différents, sur des 
périodes différentes. On appelle de telles observations des « données panel ». 


Données réelles ou nominales 


Une variable de flux ou de stock peut généralement être mesurée en termes nominaux (à 
prix courants, en valeur...) ou en termes réels (à prix constants, en volume...). La mesure 
en termes réels est égale à la mesure en termes nominaux divisée par un indice de prix 
approprié. Le choix d’un type de mesure au détriment de l’autre dépend logiquement du 
contexte de la relation étudiée. De manière générale, la variable dépendante et certaines 
variables explicatives doivent être exprimées en termes réels si la valeur réelle de la variable 
dépendante reste inchangée quand les valeurs nominales de ces variables explicatives 
doublent et que tous les prix doublent simultanément. 


Certaines variables de taux existent en version nominale ou réelle. C’est le cas des taux 
d’intérêt et des taux de change. On réalise une approximation du taux d’intérêt réel en 
calculant la différence entre le taux d’intérêt nominal et le taux d'inflation. On obtient le 
taux de change réel entre deux devises en multipliant le taux de change nominal par le 
rapport entre les indices de prix des deux zones concernées. Une fois de plus, le choix de 
l’une des deux versions est dicté logiquement par le contexte de la relation étudiée. 


Formulation statistique des relations 
économiques 


En économétrie, on suppose généralement que les variables économiques sont aléatoires. 
q 
En d’autres termes, on considère que la valeur observée d’un phénomène économique, 
q 
par exemple l'investissement total effectué durant une année particulière, est en partie 
due au hasard : c’est la réalisation d’une variable aléatoire correspondante susceptible de 
produire d’autres réalisations si l’on répéte l'expérience. 


Exemple 


À chaque période t, on observe la valeur de la variable aléatoire c,, en l'occurrence la consom- 
mation, mais, d’un point de vue conceptuel, on pourrait observer d'autres valeurs, éventuellement 
différentes, si l’on répétait l'expérience. De la même manière, à chaque période ft, les valeurs 
effectivement observées de yd, et r; sont perçues comme des réalisations uniques des variables 
aléatoires correspondantes yd, et r;, qui pourraient avoir d'autres réalisations. 
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Le hasard détermine en partie les réalisations effectivement observées des variables éco- 


nomiques et les résultats auraient pu être différents. Les probabilités d'obtenir telle ou 
telle valeur effectivement réalisée sont déterminées par les distributions statistiques des 
variables. Les relations économiques supposées par la théorie économique imposent 
des liaisons entre ces distributions. 


Exemple 


Une relation comme {a’) relie les réalisations particulières des variables aléatoires c,, yd, et 
r. qu'elle contient, par une forme fonctionnelle avec des coefficients a, B et y supposés non 
aléatoires. Habituellement, on ajoute un aléa w; à la relation : 


G = à + Byd + yr + us (a) 


(L'exemple est présenté dans un cadre temporel, mais il en va de même en coupe instantanée : 
c = œ + Byd; + yr; + ui, où en panel : c; = à + Bydi + yris + ui.) 


On justifie de différentes façons la présence d’un aléa dans une relation entre des variables. 
Très souvent, on affirme qu’une relation économique n’est pas une représentation exacte 
et complète de la réalité. Elle ne reprend que les principaux facteurs qui influencent c; 
Paléa u, communément appelé « terme d’erreur », représente tous les effets qui ont 
tendance à se compenser mutuellement, de toutes les autres variables qui influencent 
également c. Cette interprétation, très intuitive, a longtemps été favorisée dans les manuels 
d’économétrie, au détriment des autres, sans que ce choix soit réellement justifié. Selon 
une autre interprétation (qui n'exclut pas la précédente), très ancienne également, les 
mesures concrètes des réalisations des variables, telles qu’elles sont calculées et publiées 
par les instituts de statistiques, s’accompagnent d’erreurs aléatoires et l’aléa u représente 
l'effet cumulé de toutes ces erreurs sur la relation originale (pour que cette dernière soit 
exacte, il faudrait que les concepts soient « parfaitement » mesurés). Autre interprétation : 
si l’on considère que la formule à + Byd, + yr, constitue une approximation de la variable 
aléatoire c; par une fonction des variables aléatoires yd, et r;, u, est l'erreur d’approximation 
qui en résulte. 


El Processus stochastiques 


En finance, en marketing et en macroéconomie, la plupart des données se présentent 
sous la forme de séries temporelles. Rappelons qu’une série temporelle est un ensemble 
d'observations qui portent toutes sur un même concept, mais à des dates successives. 
On suppose qu'à chaque période, la donnée observée est une réalisation (unique) d’une 
variable aléatoire spécifique, et que l’on obtiendrait d’autres réalisations si l’on répétait 
l'expérience. On mesure donc la réalisation d’une variable aléatoire (univariée) par 
période et l’ensemble des variables aléatoires considérées sur les périodes successives 
forme un processus stochastique. Une série temporellee est une réalisation d’un processus 
stochastique, au sens où chaque donnée de la série est la réalisation de l’une des variables 
aléatoires qui composent le processus stochastique. 


Les processus stochastiques se répartissent en deux groupes selon qu’ils sont stationnaires 
ou non. Lorsqu'ils le sont, l'espérance (valeur moyenne) et la variance (dispersion) restent 
constantes dans le temps, et les covariances entre des composantes de dates différentes 


Processus stochastiques 7 


ne dépendent que de l’écart de temps qui les sépare. Un cas particulier de processus 
stochastique stationnaire est le processus « bruit blanc » (traduction littérale de « white 
noise ») : l'espérance est nulle en toute période, la variance est constante dans le temps et 
les covariances entre composantes de dates différentes sont toujours nulles. 


Les processus stochastiques non stationnaires se répartissent eux-mêmes en deux groupes 
selon qu’ils sont à tendance uniquement déterministe ou à tendance stochastique (on 
les appelle alors « processus intégrés » ou « processus à racine unitaire »). Lorsqu'ils sont 
à tendance uniquement déterministe, leur non-stationnarité est due à un phénomène 
purement mécanique ; elle est inhérente à leur partie déterministe, mais en rien à leur 
partie aléatoire. Lorsqu'ils sont à tendance stochastique, leur non-stationnarité est due à 
une accumulation progressive de chocs aléatoires ; elle est donc au moins partiellement 
inhérente à leur partie aléatoire. Ces processus peuvent avoir également une tendance 
déterministe. 


Si l’on travaille avec des séries temporelles, le choix des méthodes d’inférence statistique 
à employer dépend de la nature des processus stochastiques qui ont généré les données. 
C’est pourquoi les distinctions évoquées précédemment sont très importantes. 


Dans un processus stochastique stationnaire, les coefficients de corrélations entre deux 
composantes de dates différentes sont appelés « coefficients d’autocorrélation ». Ils ne 
dépendent que de l’écart de temps, ou retard, qui sépare les deux composantes. La 
succession de ces coefficients d’autocorrélation, pour des retards croissants, forment ce 
que l’on appelle un « autocorrélogramme ». Il montre avec quelle intensité les réalisations 
du processus restent liées linéairement à leurs valeurs passées, pour des retards de plus en 
plus éloignés. 


E1 Modèles statiques ou dynamiques 
et théorie économique 


Un modèle statique implique que influence d’une variation d’une variable explicative sur 
la variable dépendante produit tous ses effets durant la période où cette variation a lieu. Il 
exclut toute inertie et tout délai dans les ajustements de la variable dépendante aux fluctua- 
tions des variables explicatives, alors qu’ils sont lun et l’autre plus la règle que l’exception. 
En effet, une variable dépendante dépend souvent des valeurs passées, et pas seulement 
des valeurs actuelles, de ses variables explicatives (délais d’ajustement), ainsi que de sa 
propre valeur passée (inertie, effets d'habitude). De nombreux phénomènes économiques 
réels sont donc mieux expliqués par un modèle dynamique plutôt que statique. 

Les relations entre les variables que la théorie économique propose sont souvent formulées 
de manière statique et représentent une situation d'équilibre (plus aucune force écono- 
mique ne pousse à changer de situation ; tous les ajustements sont effectués). Pour autant, 
la théorie économique ne prétend pas que, dans la réalité, la situation soit équilibrée à 
chaque instant. Les données observées rendent compte obligatoirement de cet état de fait. 
Il est donc erroné de vérifier une théorie en estimant le modèle statique issu de cette 
théorie à partir des données observées, car la relation d’équilibre théorique n’est pas vraie 
à chaque période. Il faut en fait estimer, sur la base de ces données, un modèle dynamique 
suffisamment riche pour prendre en compte toutes les inerties et délais d'ajustement, et 
vérifier que la relation entre les variables mises en jeu pour une situation d’équilibre est 
compatible avec la relation d'équilibre théorique. Pour qu’il en soit ainsi, on peut imposer 
aux paramètres du modèle dynamique général les contraintes ou restrictions nécessaires. 
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Un modèle dynamique général relie une variable dépendante à ses valeurs passées et 
aux valeurs présentes et passées de ses variables explicatives. Ce modèle décrit donc 
la trajectoire de la variable dépendante en fonction de la trajectoire de ses variables 
explicatives. 


Exemple 


Soit une variable dépendante In(Y), et ses variables explicatives In(X), In(W) et In(L). Si l’on 
ne prend qu'une valeur passée pour chaque variable, le modèle dynamique s'écrit comme suit, 
les deux formes étant équivalentes : 


In YŸ, =; +8B2lnX; + B3lnX;-1 + Baln W, +B5ln Ws_: 
+ Beln Li + B71nLi_1 + Bg ln Ye_1 + w 
AnYŸ;—In 1) = 1 +82 AnX; —InX;_1) + (B2 + B3) In X5-1 + Ba (in W; —-InW;_1) 
+ (B4 + B5) In W:_1 + B6 (nl: —InL:_1) + (Be + B7) In Li-1 
+ (B8 — 1)In Ÿ:_1 +w 


2 


La solution d’équilibre stationnaire de ce modèle dynamique général est la relation entre 
les variables qui prévaut dans une situation où elles restent toutes constantes à chaque 
période, tout en respectant la relation décrite par le modèle dynamique général. 


Exemple (suite) 
Dans l'exemple précédent, la solution d'équilibre stationnaire est : 

In Ÿ — Bi + B2 in X + B31n X + Ba ln W + B5 In W + BéL + BTE + Be In Ÿ 
ou encore : 


In Ÿ — (B1) + (B2 + B3) In X + (Ba + B5) In W + (Bs + Br)Ini 
1—B8 


La solution de croissance équilibrée d’un modèle dynamique général est la relation entre 
les variables qui prévaut dans une situation où elles croissent au même taux, tout en 
respectant la relation décrite par le modèle dynamique général. 


Exemple (suite) 
Dans l'exemple précédent, il faut donc imposer que les taux de croissance de Y, X, W et I, 
qui sont respectivement donnés par In(Y;) — In(Y;_ 1), In(X;) — In(X5_1), In(W:) — In(W;_1) et 
In(L:) — In(L_1), soient des constantes : 

n(Y) — ns) =gc, Vt 

In(Xs) —In(X;1) =gy, Vt 

m(W:) —In(Wi:1) =gw, Vé 
mL) —M(Li1)=g, Vt 


La solution de croissance équilibrée est alors : 


gv = Bi + Bagx + (B2 + B3) In X5-1 + Bagw + (Ba + B5) In Wi-1 
+ Begz + (Be + B7) Li-1 + (Bs — DInYs1, Vt 
ou encore : 
(B1 + Bagx + Bagw + Begz — gr) + (B2 + B3) In X; + (Ba + B5) In W; + (Be + B7)In Le 
1— Bs 


In Y, — 


) 


Modèles statiques où dynamiques et théorie économique 


10 


Remarque 


Parfois, même en croissance équilibrée, certaines variables ne peuvent avoir logiquement 
qu'une croissance nulle (comme en équilibre stationnaire]. C'est généralement le cas des 
variables de taux, comme les taux d'intérêt. 


Exemple (suite) 

Si c'est le cas de L dans l'exemple précédent, alors g, = 0 et 

(B1 + Bagx + Bagw — gv) + (B2 + B3) In X; + (Ba + B5) In W, + (B6 + Br) In £ 
1 — fs | 


In Y, = 


Parfois la théorie économique suggère qu’à long terme, la variable dépendante doit être 
proportionnelle à une variable explicative, c’est-à-dire avoir une élasticité unitaire par 
rapport à cette variable explicative. Il est alors aisé d’identifier les conditions nécessaires 
sur les coefficients du modèle dynamique général pour que ses solutions d’équilibre 
soient compatibles avec la théorie. Le mécanisme à correction d’erreur est le modèle 
qu’on obtient en imposant ces restrictions au modèle linéaire général. 


Exemple (suite) 


Soit le cas de figure suivant : selon la théorie économique, à long terme Y doit être proportionnel 
à X, et donc l’élasticité de long terme de Y à X doit être égale à 1. Pour que les solutions 
d'équilibre du modèle linéaire général soient compatibles avec cette théorie, il faut que B2+B3 = 
1— 3. Le mécanisme à correction d’erreur est alors le modèle qu'on obtient en imposant 
cette restriction au modèle linéaire général : 


An Y;— In Y;-1) = Bi +2 An X; — In X5_1) + Ba (An W; — In Wi_1) + (Ba + B5) In We 
+ B6 (in L; — In Ls_1) + (Be + B7) In Li-1 + (B8 — 1) (in Ys-1 — In X+_1) + we 


Résumé 


L'économétrie permet de vérifier l'existence de relations de dépendance entre 
des phénomènes et de mesurer les taux de réaction qui caractérisent ces 
relations, en utilisant des données observées. Pour réaliser ces objectifs, toute 
relation doit d’abord être exprimée mathématiquement au moyen d’une forme 
fonctionnelle appropriée. La linéarité ne se justifie que lorsqu'il est réaliste de 
supposer que l’impact d’une même variation d’une variable explicative sur 
la variable dépendante est toujours le même, quels que soient les niveaux des 
variables au départ. L'économétrie reconnaît d'emblée le caractère stochastique 
des phénomènes qu’elle étudie. Les variables observées sont ainsi considérées 
comme des réalisations de variables aléatoires et les modèles spécifiés sont 
perçus comme pertinents à un terme d’erreur aléatoire près. Il est souvent 
nécessaire de recourir à des modèles dynamiques pour rendre compte de 
l’inertie des comportements. Pour plus de détails sur la nature de l’économétrie 
et sur certains points développés dans ce chapitre, on peut se référer à Johnston 
et DiNardo [JOH 1997], Hendry [HEN 1995] et Spanos [SPA 1986]. 
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Problèmes 
et exercices 


EXERCICE | VENTES ET PUBLICITÉ 


Énoncé 


Les ventes V d’une entreprise sont une fonction croissante de ses dépenses de publicité 
PUB, mais au fur et à mesure que les dépenses de publicité augmentent, l’accroissement 
des ventes devient de plus en plus faible, d'autant plus que le niveau de départ des dépenses 
publicitaires est élevé. 

La relation entre les ventes V et les dépenses de publicité PUB est-elle bien représentée 
par une des spécifications suivantes, et laquelle ? 


Vr = Bi + B2PUB,, avec B1 > 0 et B2 > 0 


MP avec B1 > 0 et O <B> <1 
V,=In(Bi+PUB®), avec B > 0 et 0 > B> > —1 


Solution La deuxième spécification représente bien la relation entre ventes et dépenses publicitaires. 


La dérivée de V; par rapport à PUB, vaut en effet B1B>PUBŸ? | et cette dérivée diminue 


quand PUB, augmente, parce que 81 > 0 et 0 < B2 < 1. 


EXERCICE 2 ÉLASTICITÉ DES VENTES AUX PRIX 


Énoncé 


Pour que l’élasticité des ventes V au prix P du produit soit en valeur absolue une fonction 
décroissante des dépenses de publicité PUB, il faut qu’une des relations suivantes prévale : 


Vi = Pom avec B1 > O0 et B2 > 0 et B3 > 0 
Vs = Bi + B2PUB, + B3P,, avec B1 > 0 et B2 > 0 et B3 < 0 
V, = BP PUB® , avec B1 > 0 et B> < 0 et B3 > 0 


Parmi ces trois relations, laquelle est à retenir? 


La première spécification est appropriée, puisque l’élasticité des ventes au prix vaut 
—(B2 + (Bs/PUB:;)). Cette expression est négative puisque B > 0, B3 > 0, et PUB, > 0 
par définition. En valeur absolue, cette élasticité vaut donc (B2 + (B3 /PUB:)). Elle décroît 
si PUB, augmente étant donné que PUB, se trouve au dénominateur et que B; > 0. 
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EXERCICE 3  SPÉCIFICATION D'UNE FONCTION DE PRODUCTION 


Énoncé 


Soit une fonction de production, qu’on représente de la manière suivante, et en prenant 
comme hypothèse d'absence de progrès technique : 


Ÿ =f(K,L) 


Y est la quantité produite, K est le capital et L emploi. 
Parmi ces deux spécifications, laquelle est réaliste : Y = o& + BK + yL ou Y = AKSL'? 


Exprimer cette relation sous une forme linéaire, Y — à + BK + yL, revient à impo- 


ser arbitrairement que les productivités marginales sont constantes, donc qu’elles ne 


oY 
dépendent pas des quantités de facteurs. En effet, avec une telle spécification, 8 — SK 


oY 
est la productivité marginale du capital et y = SL est la productivité marginale du 


travail. Ces productivités marginales sont supposées indépendantes des quantités de 
facteurs, puisqu'elles sont égales à des constantes B et y. Par conséquent, en modélisant 
la production de cette manière, on ignore délibérément des caractéristiques bien connues 
de beaucoup de processus de production réels. On ne tient pas compte en particulier 
des deux phénomènes suivants : la productivité marginale du travail diminue quand la 
quantité de travail augmente et que le stock de capital reste à un niveau constant, et elle 
croît quand le stock de capital augmente et que la quantité de travail reste inchangée. 
Concrètement, ajouter l’un après l’autre des ouvriers supplémentaires à une équipe qui 
travaille sur une machine conduit en général à des accroissements de moins en moins 
importants de la production et devient au bout d’un certain temps contre-productif 
(on provoque une congestion qui diminue la production). Par contre, mieux équiper 
les ouvriers permet d'augmenter la contribution productive apportée par une éventuelle 
main-d'oeuvre supplémentaire. Une spécification linéaire de la fonction de production 
n'implique pas ces propriétés réalistes ; elle est donc inadéquate dans Le cas d’une fonction 
de production. 


Pour représenter correctement de telles caractéristiques, on utilise des formes fonction- 
nelles non linéaires comme la fonction de Cobb-Douglas : 


Y = AKPLY' 


OY Y 
La productivité marginale du travail se mesure alors par Ste AyKPLY-! = — et la 


by 


Di : : 0Y - : 
productivité marginale du capital par SK — ABKŸ IL) = Fa Cette fois, les producti- 
vités marginales ne sont pas constantes, mais varient en fonction du niveau déjà atteint 
par L et K. On peut vérifier qu’elles respectent les propriétés réalistes mises en évidence 
précédemment. En effet, quand K est inchangé, le supplément SL de production induit 


par l'intervention d’un ouvrier supplémentaire diminue au fur et à mesure qu'augmente 


o(%) 


3L 12 est 


le nombre d'ouvriers L déjà en place : 
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négatif à condition que y soit inférieur à 1. Pour un nombre donné L d’ouvriers déjà à 
l'œuvre, augmenter Le stock de capital K permet d’accroître le supplément de production 
apporté par un intervenant supplétif : 


C ) 
Y 
PP nn PE 
dk LK 


EXERCICE À FONCTION DE CONSOMMATION À PRIX COURANTS 
OÙ CONSTANTS ? 


Énoncé 


Soient c; les quantités consommées et p; leur prix, à la période f. La consommation réelle 
est donc c; et la consommation nominale C; = p;c4. Le revenu nominal est Y, et le revenu 
réel est y; — Y;/p4. En termes nominaux, la relation entre consommation et revenu est 
C; = a + bY, tandis qu’en termes réels, elle s’écrit c,; = a + by,. 

La relation entre consommation et revenu doit-elle être spécifiée en termes réels ou 
nominaux ? 


En termes nominaux, la relation est C; = a + bY,, et donc p,c, = a+ bY,, ce qui implique 

que © —= (a/p:) + b(Y:/p:), c’est-à-dire c; = (a/p;) + by:. Si les prix p; et le revenu 
nominal Ÿ; doublent simultanément, le revenu réel y; reste inchangé. Toutefois, le terme 
a/p+ change. La relation C; = a + bY, implique donc que les quantités consommées c; 
diminuent lorsque les prix et le revenu nominal doublent simultanément. 
Logiquement, si Les prix doublent et que le revenu nominal double aussi, cela ne change 
rien au pouvoir d'achat des consommateurs ; les quantités achetées devraient rester 
inchangées. La relation en termes nominaux ne reflète donc pas un comportement 
rationnel de la part des consommateurs. Il faut lui préférer la relation en termes réels : 
& = a + by:. 


EXERCICE 5 CONSOMMATION, REVENU DISPONIBLE ET SALAIRE 


Énoncé 


On ajoute à la relation c = à + Byd + yr d’autres variables explicatives susceptibles de 
contribuer à déterminer l’évolution de la consommation, en l’occurrence le niveau moyen 
des salaires w— parce que « lorsque les salaires augmentent, le revenu disponible augmente 
et la consommation s’élève ». On formule une nouvelle relation linéaire de la forme : 


c= à + Byd + yr + kw (a”) 


Cette suggestion est-elle raisonnable? 


Cette suggestion n’est pas fondée. Cette relation est redondante et n’est pas correctement 
spécifiée. Pourquoi? Le coefficient X est la dérivée partielle de c par rapport au salaire w. 
Il mesure donc la réaction de la consommation c à une variation des salaires w, le revenu 
disponible yd et le taux d’intérêt restant inchangés. Or on a voulu justifier l'apport 
de w en indiquant que ses variations provoquent une variation du revenu disponible yd, 
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et par là même de c. Manifestement, À ne mesure pas ce type d’effet, mais plutôt un 
impact direct hypothétique de w sur c, quand yd est inchangé (donc un effet de w 
sur c, qui ne passerait pas par yd). C’est tout à fait différent de l’effet indirect qu'on 
voulait (inutilement) mettre en évidence — w influence yd, qui lui-même influence c — 
et qui est déjà pris en compte à travers yd dans l'équation; il n’est donc pas nécessaire 
d'ajouter w. Le coefficient f mesure l'impact sur c d’une variation de yd, quelles que 
soient les causes de ce changement, y compris une variation de w. Pour ajouter w à 
Péquation (a’), et donc utiliser (a”), il faut être sûr que, indépendamment de son effet 
indirect via son influence sur yd, w influence aussi directement c, pour une autre raison 
(c’est seulement cet autre effet qui sera mesuré par son coefficient). Dans l'exemple 
utilisé, il est difficile de justifier économiquement une telle hypothèse. Pour expliquer les 
variations de c, il est donc inutile d’ajouter la variable explicative w quand elle n’exerce 
qu'un effet indirect sur c. Mais quand l'intérêt de l'étude porte effectivement sur la 
mesure de l’effet indirect de w sur c, et non sur une explication des variations de c, 
comment mesurer cet effet indirect? Il faut spécifier une nouvelle relation dans le modèle, 
qui explique yd en fonction de w et de ses autres déterminants qu’on représente ici 
par une variable x : par exemple, yd = p + @w + lix. L'effet indirect de w sur c est 


) 0c à 

Re BY; il est obtenu à partir des coefficients de deux équations 
ô 0yd 8w 

différentes. 


EXERCICE 6 TAUX D'INTÉRÊT NOMINAL OÙ RÉEL® 


Énoncé 


Le revenu nominal est Y, à la période f, et Y,, à la période t + 1. Soient c, les quantités 
consommées, et p; leur prix, à la période ft. Soient c;,1 les quantités consommées, et 
Pr leur prix, à la période f + 1. Les consommations nominales des deux périodes sont 
C = pro et Cri = Prricr1. Le taux d’intérêt nominal est R;. Le taux d'intérêt réel 
CT — (G + R;)/( + 1) — 1, où 1, est le taux d'inflation : I; = (p:41 — p:)/p+. 
Les consommateurs choisissent les quantités consommées c, et c41 sous la contrainte 
budgétaire nominale intertemporelle C;41 = (Y; — C;)(1 + R:) + Y:41. On veut spécifier 
un modèle expliquant les quantités consommées c; en fonction du revenu réel y;, du 
revenu réel y,,, et du taux d’intérêt. 


Celui-ci doit-il être le taux d’intérêt nominal ou réel? 


La contrainte budgétaire nominale est encore pricr1 = (Y — pi)(1 + Ri) + Yi, 
ce qui implique la relation suivante entre les quantités consommées : c;}1 — 
[(/p0) — &)/(A + R:)/(pix1/p))] + (er1/pr). Cette contrainte peut se réécrire 
ainsi : Gy1 = [((Y:/p1) — &)/(A + R)/(pi1/p))] + (Mix1/ pen). Elle devient donc 
Cu = ( — &)/( + r) + ya, où y —= Y,/p, est le revenu réel à la période #, 
Yr1 = Yr11/pr11 est le revenu réel à la période t + 1, r, est le taux d’intérêt réel, défini 
par r = (1+R,)/(1 +1,) — 1 et I, est le taux d'inflation défini par 1, = (p;11 — p;)/p4. 
La contrainte budgétaire ainsi exprimée montre que les choix des quantités consommées 
aux périodes t et f + 1 sont influencés par les revenus réels aux périodes f et t + 1 et par le 
taux d’intérêt réel. C’est donc le taux d’intérêt réel, et non le taux d’intérêt nominal, qui 
doit intervenir dans une fonction explicative des quantités consommées. 
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EXERCICE 7 CHOIX DES DONNÉES 


Énoncé 


La fonction de consommation suivante explique les dépenses c en fonction du revenu 
disponible yd et du taux d’intérêt r : 


c=a+f$yd+7yr 


Vous voulez vérifier la pertinence de ce modèle, c’est-à-dire vous assurer qu’il peut rendre 
compte des données observées. Expliquez dans quels cas vous utilisez : 


des données en séries temporelles ; 
des données en coupe instantanée ; 
des données panel. 


Séries temporelles. Si la fonction de consommation semble une bonne description de 
la manière dont la consommation agrégée d’un pays évolue d’une période à l’autre, en 
fonction de l’évolution temporelle du revenu et du taux d’intérêt, cette fonction peut être 
vue comme une relation stable et valable à toute période f. Soient c, la consommation 
réelle agrégée durant la période t, yd; le revenu disponible réel durant la période f, et r; 
le taux d'intérêt moyen durant la période f. L’équation devient : 


œG =a@+$Byd; +'yr,, pourtoutt 


Les coefficients ot, B, y ne sont pas indicés par f, contrairement aux variables c,, yd, et r;. 
On les suppose constants dans le temps. La relation économique théorique représentée 
par la fonction de consommation est vraisemblablement une loi économique stable dans 
le temps. C’est une hypothèse forte, mais dans la mesure où la théorie économique a une 
quelconque validité pour expliquer les phénomènes économiques, on peut supposer 
l'existence des relations stables. Pour les vérifier, il faut estimer leurs coefficients à partir 
des observations historiques de c, yd et r, appelées « séries temporelles ». 


Données en coupe instantanée. Si l'équation semble plutôt décrire la manière dont 
différents agents (ici les consommateurs) déterminent leur consommation particulière 
en fonction de leur revenu disponible personnel et du taux d’intérêt, durant une période 
donnée, elle peut être vue comme une relation commune aux différents agents. Soient 
c; la consommation de l'agent i, yd; le revenu disponible de Pagent jet r; le taux d’intérêt 
auquel l’agent ; peut prêter ou emprunter. Le modèle devient : 


G=a+fByd; + yr;, pour touti 


Les taux de réaction à ces variables, c’est-à-dire les coefficients 8 et y, sont supposés 
les mêmes pour tous les agents, durant une période d’étude donnée. Pour vérifier cette 
relation, il faut la confronter à des observations concrètes de la consommation, du 
revenu et du taux d'intérêt pour un ensemble d’agents différents, durant une période 
précise. Ces observations sont les données en coupe instantanée. Remarque : quand le 
taux d'intérêt est le même pour tous les consommateurs, et prend donc une valeur r, 
son effet est dilué dans un terme constant commun représenté par & + yr et le taux de 
réaction y n’est pas identifiable. 
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+ Données panel. Si l'équation semble décrire la manière dont la consommation varie 


d’une période à l’autre et diffère d’un agent à l’autre en fonction de l’évolution dans 
le temps du revenu et du taux d'intérêt et de leurs différences d’un agent à l’autre, la 
fonction de consommation peut être vue comme une relation stable et commune à tous, 
décrivant le comportement de tous les agents durant toutes les périodes. Soient c;, la 
consommation en termes réels de l'agent ; durant la période f, yd;, le revenu disponible 
réel de l'agent i durant la période f, et r; le taux d’intérêt pour l’agent j durant la 
période t. L'équation devient : 


Ci = à + Byd;; + Yri, pour tout i et pour tout f 


On peut remplacer r; par r. quand on suppose que tous les agents ont le même 
taux d’intérêt. Pour mesurer et vérifier une telle relation, il faut la confronter à des 
observations du revenu et du taux d’intérêt pour un ensemble d’agents différents, sur 
des périodes différentes de la consommation. De telles données sont appelées « données 
panel ». 


EXERCICE 8 SPÉCIFICATION D'UNE FONCTION 


DE CONSOMMATION DYNAMIQUE 


Énoncé 


Les théories macroéconomiques à fondements microéconomiques impliquent générale- 
ment que la consommation réelle agrégée est, à l’équilibre (à « long terme »), propor- 
tionnelle au revenu disponible réel agrégé et que la constante de proportionnalité est une 
fonction du taux de croissance d’équilibre du revenu disponible réel, du taux d’inflation 
d'équilibre et du taux d’intérêt d’équilibre. Spécifiez un modèle dynamique explicatif de 
la consommation agrégée, en veillant à ce que ses solutions d’équilibre respectent ce qui 
vient d’être dit. 


2 


La relation d’équilibre théorique peut se formuler ainsi : 


Cr = AY,, avec A = f(gy,gp,R) 


\ 


où 
Y: est Le revenu disponible réel agrégé à la période f; 
gy est le taux de croissance d’équilibre du revenu disponible réel ; 


2 


g est le taux d'inflation d'équilibre (ou taux de croissance d’équilibre des prix) ; 
R est la valeur d’équilibre du taux d’intérêt ; 

C; est la consommation réelle agrégée à la période f. 

Cette relation théorique s’écrit : 


In(C;) = A'+In(Y,), où 4’ = In(A) 


N 


La théorie implique donc que, à équilibre, Pélasticité de la consommation au revenu est 
unitaire : 


2C Y  dIn(C) 2 
PC. din) 
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Il faut commencer par estimer, à partir des données, un modèle dynamique général 
(MDG) qui contient les valeurs présentes et passées de chaque variable : 


In C; = Bi + B2ln Ÿ; + B3 ln Y;_1 + BalnP, 
+ 5 In Ps 1 + BR: + B7R:-1 + Be In Ci-1 + 


Ce modèle dynamique capte tous les délais d’ajustement, effets d'habitude et autres 
inerties, tous les déséquilibres de court terme qui font que la consommation n’est pas, à 
chaque période, en relation d’équilibre avec ses déterminants. On peut écrire ce modèle 
dynamique général d’une autre manière, sachant que l'égalité se maintient si l’on soustrait 
la même quantité à gauche et à droite : 
In C; — In Cri = Bi + B2n Y; + B3 In Y:_1 + Baln P; + B5 In P;_: 
+ BR: + B7R;-1 + (B8 — 1) In C1 + w 
Le membre de droite est évidemment inchangé si on ajoute et soustrait en même temps 
les mêmes éléments : 
In C; — In C1 = Bi + B2ln Y; — B2ln Ye_1 + B2ln Ÿ;_1 + B3ln Ye: 
+ Baln P; — Baln P;_1 + Baln P; 1 + BslnP; : 
+ BeRr — BeRs-1 + B6Rs-1 + B7Rs-1 
+ (Bs — 1)n C1 + w; 


Cela peut encore s’écrire de la manière suivante : 


In C; — In C1 = Bi + B2 (in Y; — In Y:_1) + (B2 + B3) In Y 1 
+ Ba An P; — In P;_1) + (Ba + B5)In Ps: 
Be CR; — Rs-1) + (Be + B7) R;-1 + (Bs — 1) In C;-1 + uw 


On obtient donc le modèle dynamique général reparamétré (MDGR) : 
nC; —InC;-1 =$ +8, AnY; —InY;_1) +$8;,1nY;:1 +8, (nP;-InP,:) 
+ 65 in Ps: + B% (Re — Rss) + B5Rs- 1 + B$ In C1 + w 
Les relations entre les paramètres des deux équations MDG et MDGR sont : 


Bi Bis Br: PB —=B:+Bs, Bi = pa, 
Bs = Bat 5, Bo Be; Br = B6+B7, Ba = (Bs — 1) 


Les équations MDG et MDGR ne sont pas deux modèles différents, mais deux écritures, 
deux représentations différentes du même modèle dynamique. L’une implique Pautre ! 

Il faut ensuite rechercher la solution d’équilibre stationnaire du modèle dynamique, qui 
est une propriété de ce modèle. Elle se présente sous la forme d’une relation entre les 
variables qu’il implique lorsqu'elles sont constantes dans le temps, lorsqu'elles sont en 
équilibre stationnaire. Dans cet exercice, la solution d’équilibre stationnaire du modèle 
dynamique est la relation entre les variables impliquées simultanément par l'équation 
MDG (ou MDGR) et les hypothèses de stationnarité suivantes : 
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Pour trouver cette solution, il suffit donc d’intégrer ces hypothèses de stationnarité dans 
l'équation MDG. On obtient : 


In C = B; + B2 In Ÿ + B31n Ÿ + Bain P + Bs In P + BR + BR + By In C 
Cela implique : 


InË = (B1) + (B2 + B3) In Ÿ + (Ba + Bs) In P + (Be + Br) À 
1 — Bs 


Ce résultat est la solution d'équilibre stationnaire du modèle dynamique (l), I] s’agit de 
la relation (et non d’un nouveau modèle) qu’il implique dans le cas particulier d’une 
situation d’équilibre stationnaire. Pour tester sur les données la théorie, il faut estimer 
le modèle dynamique et vérifier que ses coefficients sont tels que sa solution d’équilibre 
stationnaire est compatible avec la relation d’équilibre de la théorie. Celle-ci est donc 
vérifiée si les hypothèses suivantes ne sont pas rejetées : 


(Ba + B5) is (B2 + B3) : 


1 — Ps L= pe 


On peut objecter que, sur des données macroéconomiques caractérisées par une croissance 
continue, le concept d'équilibre stationnaire est peu pertinent. On peut aussi rechercher la 
solution de croissance équilibrée du modèle dynamique qui est une autre de ses propriétés. 
Cette solution est la relation entre les variables que le modèle implique lorsque toutes celles 
qui représentent le flux, les stocks et les prix croissent à un taux constant dans le temps 
(elles sont en croissance équilibrée) et que les variables relatives aux taux sont constantes 
dans le temps (elles sont en équilibre stationnaire puisqu’il est insensé qu’un taux d’intérêt 
augmente à un taux de croissance constant indéfiniment). Dans cet exercice, la solution de 
croissance équilibrée du modèle dynamique est la relation entre les variables impliquées 
simultanément par l'équation MDG (ou MDGR) et les hypothèses de croissance équilibrée 
suivantes : 


1 


In(C;) — In(C-1) =ge, Vt 
n(Y;) —In(Ys1) = gr, Vt 
Rr=Re1=R, Vi 
In(P;) —In(Ps1) = gp, Vt 
Pour trouver cette solution, il est préférable d’utiliser la représentation MDGR du modèle 


dynamique. Si l’on intègre ces hypothèses de croissance équilibrée dans l’équation MDG, 
on trouve : 


ge = PB + Bogr + Bin Ÿ: 1 + Bigp + BiinP; 1 + BR 1 +BsinCr 1, Vt 


Cela implique : 
8 
Et donc: 
A 


Bs 


1. On trouve exactement la même solution en substituant les hypothèses de stationnarité dans Péquation 
MDGR. C’est logique puisque MDG et MDGR sont deux représentations différentes du même modèle. 
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Ou, de manière équivalente : 


(B1 + Bagy + Bag — go) + (B2 + B3) In Y: + (Ba + B5) In P, + (B6 + B7) À 
1 —$s 


Ce résultat est la solution de croissance équilibrée du modèle dynamique. Il s’agit de la 
relation qu’il implique dans le cas particulier d’une situation de croissance équilibrée. 
Pour tester sur les données la théorie, il faut estimer le modèle dynamique et vérifier que 
ses coefficients sont tels que sa solution de croissance équilibrée est compatible avec le 
postulat de relation d’équilibre théorique. Cette relation est donc vérifiée si les restrictions 
ou hypothèses suivantes ne sont pas rejetées : 


(Ba + B5) Dr: Sr (B2 + B3) 5 


1 — Ps 1 — Ps 


Pour s’assurer que le modèle dynamique général respecte la théorie, c’est-à-dire pour que 
ses solutions d'équilibre stationnaire et de croissance équilibrée soient compatibles avec 
la relation d’équilibre de la théorie économique, il suffit d'imposer ces contraintes à ses 
paramètres. Si l’on procède ainsi, le modèle dynamique général devient le mécanisme à 
correction d’erreur, en loccurrence : 


IncC, — » Vt 


InC;—InCs_1 = 1 +62 (in Y; —InY;_;) + (1 — Bs) (An Y;_1 —InC;_:) 
+ Ba An P; — In P;_1) + B6 CR: — Re-1) + (Be + B7) Ri-1 + w 


On peut calculer ses solutions d’équilibre stationnaire et de croissance équilibrée : 


ere BDTÉTPBIR y 
1 — 8 
hé (B1 + (B2 28 ms + (B + B7) À L ny, 
— Be 


Elles sont bien compatibles avec la théorie macroéconomique. Quand C est proportionnel 
à Y, £C — Sr. 


EXERCICE 9  SPÉCIFICATION D'UN MODÈLE DYNAMIQUE DE TAUX DE CHANGE 


Énoncé 


La théorie de la parité des pouvoirs d'achat implique qu’à l'équilibre, le taux de change 
entre deux devises s’ajuste de manière à égaliser le coût d’acquisition d’un panier de biens 
dans les deux pays concernés, lorsque les biens sont exprimés dans une même devise. 
À court terme, le taux de change fluctue également en fonction d’autres variables, tel le 
différentiel de taux d’intérêts nominaux entre les deux pays. Spécifiez un modèle explicatif 
de l’évolution du taux de change e;; entre les devises de deux pays i et j, qui soit approprié 
à court terme tout en étant compatible avec la théorie de la parité des pouvoirs d’achat à 
long terme. Supposez que les périodes sont annuelles et que la dynamique peut se réduire 
à des retards d’une période. 
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Soit e;; le taux de change défini comme le prix d’une unité de devise i exprimé en unités 
de devise j. Les variables explicatives suggérées par l’énoncé sont : 


pi, l’indice des prix dans le pays i, en devises du pays ï; 
pj, l'indice de prix dans le pays j, en devise du pays j; 
Ri, le taux d’intérêt nominal à court terme pour la devise du pays j; 
R;, le taux d’intérêt nominal à court terme pour la devise du pays j. 
En données annuelles, on suppose que la dynamique peut se réduire à une période. On 
spécifie le modèle dynamique général : 
Ines) = Bi + BaRi + B5Ri-1 + Balnpi) + Bs np) + Beln(pi-1) + B7 In(pi-1) 
+ BR + BoRi-1 + Bio In(eis-1) + 
Cela peut s’écrire ainsi : 
(In(ee) — In(ei-1)) = B1 + Ba(Ri — Ri-1) + (B2 + B3)Ri-1 + Ba(In(pi) — In(pi-1)) 
+ B5 (In(p) sn In(pjr-1)) + (B5 + B6) In(p;_1) 
(Ba + B7) In(pi_1) + B8(Ri — Rjr_1) 
(B8 + Bo)Rj-1 + (Bio — 1) In(es_1) + w 


La théorie de la parité des pouvoirs d’achat suggère qu’à l'équilibre : 


Pirée = Kpi 
où k est un facteur de proportionnalité tenant compte de différences éventuelles dans la 
composition et le choix de l’année de base des indices de prix des deux pays. Cette relation 
d'équilibre s’écrit encore : 
In(ei:) = A + In(pi) — In(pà) 


où À = In(k). La solution d’équilibre stationnaire du modèle dynamique général est : 


In(er) = (B1 + (B2 + B3)Ri + (Ba + B7) In(pu) 
+ (Bs + Bo) np) + (Bs + Bo)R;)/( — Bio) 

puisque Ri = Ri-1, R; = Rj- jt = Eijt-1s Pit = Pir-1 et Pit = Pjr-1. La solution de 
croissance équilibrée s'écrit : 

In(e;:) — (Bi + Bag: + Bsg; — ge) + (B2 + B3)Ri + (Ba + B7) In(pi) 

+ (B5 + 6) In(pis) + (Bs + Bo)R})/(1 — Bio) 
OÙ ge = Ines) — In(é-1), gi = In(pi) — In(pi-1), g = In(pj) — mpi-1), Ri = Ris: 
et Rj = Rjÿ-1. Pour être compatibles avec la relation théorique In(e;;) = À + In(p;) — 
In(p:), les coefficients de ces solutions d’équilibre doivent être contraints de sorte que 
(Bs + B6)/(1 — Bio) = (Ba + B7)/(1 — Bio) = 1. À l'équilibre, la relation théorique 
In(ei-1) = A+ln(pi)—In(p;) implique aussi que g. = g;—gi. En imposant ces restrictions 
au modèle dynamique général, on obtient le mécanisme à correction d’erreur : 
(In(e;;) = In(er-1)) = Bi + Ba(Ris — Ris-1) + (Ba + Bs)Ri-1 + Ba(In(pir) = In(pi-1)) 

+ B5 (In(pj) — In(pi-1)) 
+ (B5 + B6)(In(pi-1) — In(pi-1) — In(es_1)) 
Bs (Rj R;-1) + (Bs + Bo)R;r-1 +u 
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El Présentation générale 


1.1 


DÉFINITION GÉNÉRALE ET NOTATION GÉNÉRALE 


Un modèle linéaire à une équation, en séries temporelles, suppose qu'une variable 
aléatoire univariée Y, est une fonction linéaire d’autres variables aléatoires univariées 
X3, X3 ... Xx, à laquelle s'ajoute une variable aléatoire univariée u, appelée « terme 
d’erreur », et émet certaines hypothèses sur la distribution de toutes ces variables. On 
représente cet ensemble d’hypothèses de la manière suivante : 


Vi = Bi + BaXx + B3X3 +: + BrXu +w, pourtoutt= 1..." (2.1) 


avec B1,B2 ... Br des coefficients non aléatoires constants dans le temps. 


+ La variable Y, est dite dépendante. Les variables X:,, X3, ... Xy, sont dites explicatives. 

Y. et les X;; sont des variables aléatoires (1 (au sens où chacune d’elles peut avoir, d’un 
point de vue conceptuel, plusieurs valeurs possibles, en fonction du hasard, même si 
l’on observe effectivement une seule réalisation puisque la période t n’« a lieu » qu'une 
fois) et observables (puisqu'on peut en observer une réalisation). 
La variable u, est appelée terme d’erreur ou perturbation. C’est une variable aléatoire 
et non observable (en effet, u, — Y; —B1 —B2X2 —B3X3 — ::: —ByrXx, mais on ne peut 
pas déduire sa réalisation des réalisations observées de Y, et des X;, car les coefficients 
B; sont inconnus et donc non observés). 


Vs, Xr, X3r.….… Xy et u, sont les composantes à la date t des processus stochastiques cor- 
respondants Y = {Yrhr=1.m À2 oui {X2}r=1.n X3 = {X3r}r=1.n ... Xk = {Xk}r=1.m et 
U = {ur}r=in 

Le coefficient B1 est souvent appelé constante (ou « terme constant ») du modèle 
linéaire. De façon implicite, une variable explicative X1, vaut 1 à chaque période t 
(X = 1 pour tout f), ce qui implique que B1X1; = B1 pour tout f. Pour cette raison, 
l'indice des variables explicatives commence à 2 dans la formulation du modèle. On 
compte donc k variables explicatives, constante comprise (soit k — 1 sans la constante !). 
Les coefficients B; sont des concepts non aléatoires (des valeurs uniques supposées 
exister dans la nature) et non observables (leur valeur est inconnue). 


Exemple 

La fonction de consommation suivante est un exemple de modèle linéaire : 
In(C;) = Bi +B2ln(YL) +B3R+w, pour toutt=1...n 

In(C;) est le logarithme népérien de la consommation à prix constants C.. 

In(ÿ1,) est le logarithme népérien du revenu disponible réel Y1.. 

R représente le taux d'intérêt réel. 

In(C;) correspond à la variable dépendante Y.. 

n(Y1) correspond à la variable explicative X2,. 

R correspond à la variable explicative X3:. 


On compte donc trois variables explicatives, constante comprise [k — 3]. In(C;), In(Y1), R; 
et u, sont les composantes à la date # des processus stochastiques correspondants In(C) = 
{n(Cr)}=rns MOD = nYL)}hrins R = {Rir=in À U = {uihri.n. 


1. Pour quelques rappels utiles sur les concepts de variable aléatoire, on peut se référer utilement au livre de 
Patrick Roger, Probabilités, statistique et processus stochastiques, publié chez Pearson Education France dans 
la même collection. 
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La fonction de consommation suivante est un autre exemple de modèle linéaire : 
In(C;) = B1 + B2n(Y1s) + B3R: + Baln(C:_1) + B5In(YL 1) +w, pourtoutt=2...n 


In(C;) correspond à la variable dépendante Y.. 
n(Y1;) correspond à la variable explicative X:,. 
R: correspond à X3.. 
In(C;_1) correspond à X4. 
In(Yl;_1) correspond à X5:. 


On compte donc cinq variables explicatives, constante comprise (k = 5]. Dans cet exemple, 
Xu = Yi et X5 = Xu-1. In(Cr), Xx, R, et w sont les composantes à la date + des processus 
stochastiques correspondants In(C) = {In(Cr}}5=1..n IMYD = {n(Yh)}rrns R = {Rain €t 
u = {ur}r=1.n. n(Cr-1) est la composante de date — 1 du processus stochastique {In(C+)}+=1..n. 
In(Y1;_1) est la composante de date # — 1 du processus stochastique {In(Y1:)}1=1..n. 


1.2 NOTATION MATRICIELLE 


L'hypothèse d’un modèle linéaire reliant des processus stochastiques X>, X3...Xz peut 
encore être présentée de la manière suivante : 


Y =XB+u (2.2) 
Yi 1 Xn -:: XH Bi U] 
ÿ 1 X2 :.: Xp B2 u2 
où Ÿ = , X = ,B = ,U = 
Yh 1 OX ce Xy Bk Un 


Y est un vecteur à n éléments (une matrice n x 1), X est une matrice à n lignes et k 
colonnes, $ est un vecteur à k éléments (une matrice k x 1) et y est un vecteur à n éléments 
(une matrice n X 1). Exprimé en notation matricielle, le modèle linéaire implique que : 


Yi = Bi + BaXa + BaX31 + PBaXa +: +: + BeXu + wi 
V2 = Bi + B2X2 + B3X 32 + BaXa + - + + BiXp + w 
Yh = Bi B2X2 B3X3n BaXan ...- Br X tn + Un 


L'équation (2.2) est bien équivalente à l'équation (2.1). 
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Dans l’équation (2.1), la somme B; + B2X2 + BaXs + BaXar +: : + + BrXx est souvent 
interprétée, de manière conventionnelle, comme la partie de la variable dépendante Y, 
qui peut « s'expliquer » linéairement en fonction des variables explicatives X2,, X3: ... Xx, 
tandis que le terme d’erreur u, est interprété comme la partie ne pouvant « s'expliquer » 
linéairement en fonction des variables explicatives. 
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Pour intuitive qu’elle soit, cette interprétation est encore trop vague et manque de rigueur. 
Il reste à préciser les différents statuts statistiques d’un modèle linéaire. La section suivante 
établit le lien entre ces statuts et certaines propriétés du terme d’erreur. 


2.1 HYPOTHÈSES SUR LE LIEN ENTRE TERME D'ERREUR 
ET VARIABLES EXPLICATIVES 


Modèle linéaire comme approximation linéaire 


Statistiquement, les coefficients d’un modèle linéaire sont les coefficients de l’approxi- 
mation linéaire de la variable dépendante par les variables explicatives, à condition que 
l'espérance du terme d’erreur soit nulle et que les covariances entre le terme d’erreur 
et chaque variable explicative soient nulles. Cela se formalise ainsi : si les processus 
stochastiques Y, X,...X, sont tels qu’ils sont reliés par le modèle linéaire (2.1) (voir 
section 1.1) sous les hypothèses que Eu) = 0 Vfet Cov(u,, X:) = 0 Vi = 2...k 
et Vf, la partie B; + B2X2,; + BaX3r + BaXu + : + + BrXx représente l’approximation 
linéaire de la variable aléatoire Y, par les variables aléatoires X}, ... Xy,. En d’autres termes, 
B = ri Exr, où X;, est un vecteur (1) aléatoire à k éléments défini par X, = (1X1,... Xx)'. 


Remarque 


l'approximation linéaire d'une variable aléatoire Y, par des variables aléatoires 
XX... Xx est une fonction linéaire des variables X:,,X3 ... Xw, dont les coefficients sont 
choisis de manière à minimiser l'espérance du carré de l'écart entre Y, et cette fonction 
linéaire. 


Avec de telles hypothèses sur le terme d’erreur, le modèle linéaire suppose donc la constance 
dans le temps des coefficients de l’approximation linéaire de Y, par X:,, X3,... Xy, et par 
là même un comportement particulier des espérances et variances des variables Y, et X; 
(i = 2...k) ainsi que des covariances entre ces variables, aux différentes périodes t. En 
effet, si ces espérances, variances et covariances varient dans le temps, elles doivent le faire 
de manière telle que Ex Ex, soit constante dans Le temps. 


Exemple avec une variable explicative (k = 2) 


Le modèle linéaire Y, = B1 + B2X2t +14, lorsqu'il comprend les hypothèses Cov(u,, X2:) = 0 pour 
Cov(Y;, Xx) 


tout t et E(u,) = 0 pour tout f, implique que la valeur de l'expression E(Y,) — yo) PC) 
2 
: Cov(Y;,X ; vu ee 
et celle de l'expression ee ne changent pas quelle que soit la période t. Les coefficients 
2 


du modèle linéaire sont alors définis statistiquement ainsi : 


… Cov(Y;, X2) … Cov(Y;, Xx) 
B1 = E(M:) — yon EC) et f2— TPE - 


1. 2x, est une matrice carrée à k lignes et k colonnes puisque c’est la matrice de variances et covariances du 
vecteur X,. Zx;,v, est une matrice à k ligne et 1 colonne, donc un vecteur, puisque c’est la matrice des covariances 
entre le vecteur X, et la variable univariée Y,. 


26 Modèle linéaire en univers stationnaire 


Chapitre 


Modèle linéaire comme approximation conditionnelle 


La partie expliquée de la variable dépendante d’un modèle linéaire est aussi une approxi- 
mation conditionnelle qui dépend d’une hypothèse plus forte que celle de la covariance 
nulle entre terme d’erreur et variables explicatives : il s’agit de l'indépendance entre 
terme d’erreur et variables explicatives. Si les processus stochastiques Y, X2 ... X4 sont tels 
qu’ils sont reliés par le modèle (2.1) sous les hypothèses que E(u;) = 0 Vf et que u, est 
indépendant de X; Vi=2...ket Vf, la somme Bi À B2X> À B3X3; t BaXar +e..+ BrXx 
représente l’approximation conditionnelle () de la variable aléatoire Y, par les variables 
aléatoires X;, ... Xy,. Par conséquent : 


Bi + BaXa + B3X 3e + BaXa + + + BrXe = E(Y:X2 ... Xx) (2.3) 


Il apparaît clairement que ce cas implique celui de la rubrique précédente (Modèle linéaire 
comme approximation linéaire). Un modèle linéaire, avec les hypothèses complémentaires 
que E(u,;) = 0 Vf et que u, est indépendant des variables explicatives X:, ... Xx, peut 
donc être interprété de la manière suivante : l’approximation conditionnelle de Y; par 
les variables explicatives X2,...Xx est une fonction linéaire de ces variables explicatives 
avec des coefficients constants dans le temps. Cela revient à dire que l’approximation 
conditionnelle de Y; par les variables explicatives est identique à l’approximation linéaire 
de Ÿ, par ces variables explicatives et que des coefficients sont constants dans le temps. 
D'ailleurs, hypothèse d'indépendance entre u, et X,...X4; pour tout f implique que 
Coviu,, Xÿ) = 0 Vi = 2...k et Vt et donc que les B; sont à la fois les coefficients de 
Papproximation linéaire et ceux de l’approximation conditionnelle. 


Remarque 


l'approximation conditionnelle est égale à l’approximation linéaire lorsque les variables 
dépendante et explicatives sont toutes distribuées normalement. En effet, si la fonction de 
densité jointe de Y, et des X; est une normale multivariée, l'espérance conditionnelle de 
Y:, conditionnellement aux réalisations des X;, est effectivement une fonction linéaire des 
réalisations des X; et est égale à l'approximation linéaire. Toutefois, la normalité n'implique 
pas à elle seule que les coefficients de l'approximation conditionnelle {et linéaire) de Y, en 
fonction des X; soient constants dans le temps. Il faut, pour cela, que la distribution jointe ait 
des propriétés supplémentaires. 


Autres cas 


Dans beaucoup de cas, en raison du contexte (la problématique économique, financière 
ou marketing) dans lequel on suppose l’existence d’une relation linéaire constante entre 
des processus stochastiques Y, X; ... X4, du type de l’équation (2.1), on ne peut supposer 
que le terme d’erreur u est indépendant des variables explicatives, ou que les covariances 
entre le terme d’erreur et les variables explicatives sont toutes nulles. Dans ces conditions, 
Pexpression B1 + B2X2 + B3X3 + BaXa + : -- + BrXx n'est pas l’approximation condi- 
tionnelle ni approximation linéaire de Y, par X2,, X3, ... Xm. Les coefficients B; ne sont 
donc pas ceux définis pour les coefficients de l’approximation linéaire. 


La simultanéité est une des causes principales de dépendance entre terme d’erreur et 
variables explicatives. Par simultanéité, on entend « influence réciproque entre variable 
dépendante et variables explicatives », c’est-à-dire « influences simultanées des variables 


1. Pour quelques rappels utiles sur le concept d’espérance conditionnelle, le lecteur peut se référer au manuel 
de Patrick Roger, Probabilités, statistique et processus stochastiques, publié chez Pearson Education France 
dans la même collection. 
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explicatives sur la variable dépendante et de la variable dépendante sur certaines 
variables explicatives ». 


Exemple 
On suppose habituellement que la consommation agrégée C; est fonction du revenu dispo- 
nible Y1, : 

Cr = Bi +B2Yl +u (a) 
Cette équation s'inscrit dans un contexte où le revenu disponible YI; est défini comme une 
partie du PIB, (produit intérieur brut}, qui est la somme des valeurs ajoutées dégagées dans 


l'économie, soit approximativement la somme des revenus primaires versés sous la forme de 
salaires, dividendes, intérêts : 


YI = PIB; — IMP, (b] 
où IMP est un montant d'impôts et de cotisations sociales nettes des prestations sociales 
octroyées. 

PIB; = C++ G:+X; — M: (cl) 


I représente l'investissement avec les variations de stock, G les dépenses publiques, X les 
exportations et M les importations. Au regard de ces trois équations, on se rend compte que 
toute variation de u, affecte C;, qui, en variant, affecte PIB, qui, en variant, affecte YI,. Le terme 
d'erreur u, et la variable explicative YI, ne sont donc pas indépendants : 


u— C— PIB— YI donc u — YI 
(a) (c) @) 


Il en résulte que les coefficients B1 et B2 ne sont pas les coefficients de l’approximation 


conditionnelle ni de l'approximation linéaire de C; par YL. En particulier, 82 n'est pas égal 
à Cov(G, YI)/V(YL). 


2.2 HYPOTHÈSES POSSIBLES SUR L'ÉVOLUTION TEMPORELLE 
DU TERME D'ERREUR 


Plusieurs hypothèses concernant la manière dont le terme d’erreur évolue dans le temps, 
et les liens éventuels qu'il a avec ses réalisations passées, sont envisageables et seule la 
nature de la problématique étudiée rend plausible l’une d’entre elles. 


Terme d’erreur bruit blanc 


Lorsqu'on fait l’hypothèse d’un modèle linéaire à coefficients constants reliant des pro- 
cessus stochastiques Y, X: ... X4, du type de l’équation (2.1), on se demande si l’ensemble 
des fluctuations systématiques de Y au cours du temps est « expliqué » par les fluctuations 
des variables explicatives X, ...XK. Si c’est le cas, toutes les composantes systématiques 
de Y, sont prises en compte par la somme B: + B2X2x + B3X3r + BaXa + - + + BrXx et 
le terme d’erreur u; ne contient plus d'éléments systématiques. On peut donc supposer 
que u, est un bruit blanc. En effet, les réalisations successives d’un bruit blanc forment 
une suite de valeurs de moyenne 0, d'amplitude ou de dispersion constante et sans lien 
linéaire entre elles. Il s’agit bien d’une succession de valeurs ne présentant aucun caractère 
systématique. 


Remarque 


Un bruit blanc est un processus stochastique dont la composante à chaque date a une 
espérance nulle et la même variance, et dont des composantes à des dates différentes ont 
une covariance nulle. 
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Terme d'erreur autocorrélé ou hétéroscédastique —_— 
Toutefois, dans beaucoup de cas, seule une partie des fluctuations systématiques de Y au 

cours du temps est « expliquée » par les fluctuations des variables explicatives X; ...X4. 

L'autre partie se retrouve dans le terme d’erreur w. Celui-ci a donc une composante 
systématique, ce qui implique qu’il n’est pas un bruit blanc (1). Trois cas de figure sont 

alors possibles : 


+ Soit le terme d’erreur d’une période est autocorrélé, c’est-à-dire qu’il est lié à toutes 
ou à certaines de ses valeurs passées : 30 2 0|cov(u,,u;-0) 7 0. On parle alors 
d’«autocorrélation du terme d’erreur » (ou des perturbations). 


+ Soit le terme d’erreur est hétéroscédastique, c’est-à-dire que sa variance (dispersion) 


varie dans le temps : V(u,) Æ 6? VYt. On parle alors d’« hétéroscédasticité du terme 


d’erreur » (ou des perturbations). 
+ Soit il est à la fois autocorrélé et hétéroscédastique. 


El Estimation par la méthode des moindres 
carrés ordinaires 


3.1 PRINCIPE DE LA MÉTHODE 


On suppose que hypothèse d’un modèle linéaire à coefficients constants reliant des pro- 
cessus stochastiques Y, X; ... X4 est correcte. On veut dire par là qu’il existe effectivement 
des coefficients « vrais inconnus » f; constants dans le temps tels que : 


Yr = Bi + BaX2 + Ba X 3 + BaXar +: + Bu + uw, Vi, comme dans l'équation (2.1) 
ce que l’on peut encore représenter par : 
Y = XB+u, comme dans l’équation (2.2) 


où Ÿ, X, B et u sont les matrices définies à la section 1.3. 


Plusieurs estimateurs du vecteur « vrai inconnu » $ des coefficients « vrais inconnus » 
B; du modèle linéaire sont possibles. Le choix du bon estimateur dépend du statut des 
coefficients B;, c’est-à-dire de leur interprétation, qui dépend elle-même des propriétés 
des distributions de probabilité des variables aléatoires multivariées Y, X, ... X4 et u (voir 
section 2). Dans cette section, on définit un estimateur très populaire : l’estimateur des 
moindres carrés ordinaires. On étudie ses propriétés sous différentes hypothèses sur le 
modèle linéaire sous-jacent, ce qui permet de déterminer dans quels cas le choix de cet 
estimateur est opportun et dans quels cas il ne l’est pas. 


Il faut donc définir la formule d’un estimateur du vecteur « vrai inconnu » B, obtenue 
en appliquant le principe des moindres carrés ordinaires (MCO). Cet estimateur est 
noté BMCO, I] s’agit d’une formule à appliquer aux réalisations observées des processus 


1. La problématique de la section 2.2 est indépendante de celle de la section 2.1 : si, par exemple, la partie 
expliquée de Y dans le modèle est l’approximation conditionnelle linéaire de Y et si, par là même, le terme 
d’erreur u est indépendant des X;, cela n'implique pas pour autant que le terme d’erreur u soit un bruit blanc. 
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Y,X2...X4, donc aux valeurs observées du vecteur Y et de la matrice X, pour obtenir une 
valeur estimée du vecteur f des coefficients « vrais inconnus ». 
En définissant un estimateur particulier BMCO de 8, on définit forcément un modèle 
estimé du type : 

Y = XBMCO Le (2.4) 


où BMCO est l’estimateur de f et e est un résidu calculé, défini ainsi : e = Y — XBMCO, 


Le modèle estimé (2.4) correspond au modèle linéaire Y = XB + u de l’équation (2.2), 
où le vecteur des coefficients « vrais inconnus » fi est remplacé par l’estimateur BMC0, 
qui est lui-même un vecteur, et où le vecteur des termes d’erreur « vrais inobservables » 


MCO 
Bi 
co 
u est remplacé par le vecteur des résidus calculés e. On a en effet BMCO — et 
e guco 
e2 . a ; 2 ; ) 
e—= |  |.Par ailleurs, le vecteur XBM, noté Ÿ, est la partie expliquée de Y. 
En 
Le modèle estimé peut encore être présenté ainsi : 
Ve = BDOO + BUICK, + + ÉMOXu He, Vt=l...n (2.5) 


où, à la période f, BMCO + BMCOX,, +... + UE. noté Ÿ,, est la partie expliquée de Y.. 
Le modèle estimé (2.5) correspond au modèle vrai (2.1) où les coefficients « vrais incon- 
nus » B; sont remplacés par leurs estimateurs BMCO et où le terme d’erreur vrai w, est 
remplacé par le résidu e,. L’estimateur des moindres carrés ordinaires BMCO minimise la 
somme des carrés des résidus, c’est-à-dire ee. On résout donc le problème d’optimisation : 


n 


À 2 
: MCO MCO MCO 
D (“- me XK) 
Bieo fMco fMeo : 
Neo UE 


Ou encore : 
min ) €} 
fMcCo fMcO à MCO 
1 > P2 D) 
Ce problème d’optimisation peut être formulé de manière matricielle : 


A ! A 
min (x à xp") ( _ xp"co) ou min de (2.6) 


fMco fMco 
La solution du problème d’optimisation est : 
BMCO = (X'X) IX Y (2.7) 


C’est la formule de l’estimateur des moindres carrés ordinaires. Chaque fois qu'un 
logiciel informatique (un simple tableur Excel ou un logiciel statistique ou économétrique 
sophistiqué) calcule par MCO une régression linéaire, il détermine les coefficients à 
l’aide de cette formule. L'ordinateur met les données de la variable dépendante dans un 
vecteur Ÿ, et les données des variables explicatives dans une matrice X. Il calcule ensuite 
la formule (2.7). 
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Remarque 


L'estimateur de MCO n'est possible que lorsque le rang de la matrice X est égal à k, c'est- 
à-dire quand aucune colonne de X {aucune variable explicative) n'est une combinaison 
linéaire exacte d'autres colonnes de X [d'autres variables explicatives]. Si une telle combinai- 
son existe, on parle alors de multicolinéarité parfaite. || est alors impossible de distinguer 
quelle est la contribution spécifique de chaque variable à l'explication de la variable dépen- 
dante ; il est mathématiquement impossible de calculer la formule de l'estimateur. En effet X’X 
est alors singulière et n’est pas inversible. 


3.2 PROPRIÉTÉS ALGÉBRIQUES DE L'ESTIMATEUR 
DES MOINDRES CARRÉS ORDINAIRES 


Les propriétés algébriques de l’estimateur des moindres carrés ordinaires découlent de la 
méthode de calcul utilisée pour obtenir la formule de cet estimateur. Ce sont donc des 
propriétés toujours vraies, qui ne dépendent pas de la véracité de telle ou telle hypothèse 
sur la distribution de probabilité des variables impliquées dans le modèle linéaire « vrai » 
supposé. Ces propriétés sont les suivantes : 


* La somme des résidus calculés vaut 0. 


s. = 0 (2.8) 
t=1 


+ Les résidus calculés sont orthogonaux aux variables explicatives. 
n 
D Xye, —=0, pourtouti=1...Kk (2.9) 
i=1 


et donc, de manière équivalente : 
Xe—0 pourtouti=1...K (2.10) 
où X; = (X1:X;... Xi)’. Cette propriété s'exprime encore ainsi : 
X'e=0 (2.11) 


puisque les différentes colonnes de la matrice X sont les différentes variables X;. Quand 
i = 1, cette propriété implique la précédente, vu que X1, = 1 pour tout f. La propriété 
d’orthogonalité signifie que la direction vectorielle du vecteur e des résidus calculés est 
orthogonale à la direction vectorielle du vecteur X; des observations de chaque variable 
explicative. Ce qui signifie que le vecteur Y a été partagé entre une partie dépendant 
des X; et une partie résiduelle e qui n’a plus aucun lien algébrique linéaire avec les 
variables X; . 


+ Les résidus calculés sont orthogonaux à la partie expliquée de la variable dépendante. 
n 
D Ÿe=0 (2.12) 
i=l 


A! 
ou encore Ÿ e = 0 
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La somme des carrés des valeurs de la variable dépendante correspond à la somme des 
carrés des valeurs de la partie expliquée et à la somme des carrés des résidus calculés. 


Sr IS Pie (2.13) 
t=1 t=1 t=1 


AI A 
ou encore YY = Ÿ Ÿ +e'e 
Cette propriété peut encore s’exprimer sous forme d’écarts à la moyenne : 


n n 


D OrDeene Ye (2.14) 
t=1 


t=1 t=1 


Pa 


Où Ÿ = ——=— = ——— est la moyenne algébrique des observations de la 


variable dépendante et est aus égale à la moyenne algébrique des valeurs expliquées 
de la variable dépendante. 

On peut définir une mesure descriptive de la « qualité » de la régression linéaire calculée. 
Ce concept, appelé R?, mesure la proportion (fraction, pourcentage...) de la variance 
empirique totale des observations de la variable dépendante qui est « expliquée », par 
la variabilité des variables explicatives. 


Ver 
=1 =] 


D A0 R Det) 


On obtient le R? en divisant la variance empirique de la partie expliquée Ÿ de la 
n A = 
er 
t=1 
. . . re 1 . . 
empirique de la variable dépendante Y dans son entièreté (cette variance empirique 


D_.œ-v) 


n—1 
au carré du coefficient de corrélation empirique entre le vecteur des observations de la 
variable dépendante et le vecteur des valeurs expliquées de la variable dépendante. 


0 (M?) 


n—1l 


— Ps = n n 
# 72 7 2 
PE — Ÿ) [Ee — Ÿ) 
n—1l 


n—1l 


R? — (2.15) 


variable dépendante (cette variance empirique est ) par la variance 


est ). Bien entendu, 0 < R? < 1. On montre que le R? est aussi égal 


2 


R? 


(2.16) 


À partir de là, on peut interpréter le R?, comme l'intensité de la liaison linéaire entre la 
variable dépendante et sa partie expliquée. Cette interprétation est bien sûr équivalente 
à la fraction de la variance empirique totale des observations de la variable dépendante 
expliquée par la variabilité des variables explicatives. 


On montre que le R? augmente nécessairement lorsqu'on ajoute une variable explicative 
au modèle et qu’on l’estime de nouveau, car la somme des carrés des résidus diminue 
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2 : L42 : 2 : L : a 5 
nécessairement. C’est pour cela qu’a été inventé un autre concept, le R? ajusté, qui 


n'augmente que si l'introduction de la nouvelle variable induit une réduction « suffi- 
samment » grande de la somme des carrés des résidus. Le R? ajusté se calcule par la 
formule suivante : 


F _ (n — 1) D e 
CE) DEN ES 2 
== (1 R) 
s TR -— (2.17) 


Le R° et le R° ajusté doivent être interprétés avec prudence. Une valeur élevée de 
ces statistiques n'implique pas nécessairement que le modèle est un « bon » modèle 
explicatif de la variable dépendante. Par exemple, si l’on régresse une série temporelle 
croissante sur une autre série temporelle croissante indépendante de la première, on 
obtient nécessairement un R? assez élevé, alors que la variable de droite n’influence pas, 
dans la réalité, les évolutions de la variable dépendante. Le R? ne fait que mesurer une 
corrélation, et celle-ci ne reflète pas nécessairement une véritable relation entre deux 
phénomènes. 


3.3 PROPRIÉTÉS STATISTIQUES DE L'ESTIMATEUR 
DES MOINDRES CARRÉS ORDINAIRES 


Cadre général 


Les propriétés statistiques de l’estimateur des moindres carrés ordinaires portent sur 
la distribution de probabilité de l’estimateur considéré comme une variable aléatoire 
multivariée. Elles dépendent donc de la véracité de certaines hypothèses sur la distribution 
de probabilité des variables impliquées dans le modèle linéaire supposé. Les variables expli- 
catives X; et la variable dépendante Y sont aléatoires et multivariées. Comme l’estimateur 
BMCO est égal à (X'X)_!X'Y, il est une fonction de variables aléatoires et donc lui-même 
aléatoire ; les propriétés de la distribution de probabilité de BMCO peuvent être déduites 
des propriétés de la distribution de probabilité conjointe de Y et des X;. L’estimateur MC 
peut encore être exprimé comme une fonction des X; (donc de X, qui rassemble tous les 
X;)et deu: 


BC = (XX) IX Y = B+ (XX) Nu (2.18) 


Il en résulte que les propriétés de la distribution de probabilité de BMC peuvent aussi être 
déduites des propriétés de la distribution de probabilité conjointe de u et des X;. 


On peut s'intéresser d’une part aux propriétés de la distribution de probabilité condition- 


nelle de BMC0, conditionnellement aux réalisations observées des variables explicatives 


(ce que l’on note par |X), d’autre part aux propriétés de la distribution inconditionnelle 


(ou marginale) de MC, 
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Remarque 


Les propriétés décrites dans les sections suivantes ne sont pas valables si la variable 

dépendante retardée {c'est-à-dire la variable dépendante prise à une date antérieure 

à la date f] est l'une des variables explicatives, pour deux raisons : 

e Le concept de distribution conditionnelle à X n'aurait aucun sens {1}. 

e La distribution inconditionnelle (marginale) aurait un sens, mais n'aurait pas les mêmes 
propriétés qu'en l'absence de variable dépendante retardée parmi les variables explicatives. 


Toutefois, les propriétés suivantes restent valables si des variables explicatives retardées sont 
présentes. 


Terme d'erreur indépendant des variables explicatives 


Si E(u;) = 0 Vf et si X;, est indépendant de u,,, Vt=1...n, VX, Vi=2...k,ona les 
propriétés suivantes : 


a) Les estimateurs des moindres carrés ordinaires sont des estimateurs sans biais des 
coefficients « vrais inconnus » du modèle linéaire () : 


E (px) =B et,si E((XX) IX) <oo, E (Be) = (2.19) 


b) Les estimateurs des moindres carrés ordinaires sont des estimateurs convergents des 


'L,X 
“ she À ET ÿ me : n 
coefficients « vrais inconnus » du modèle linéaire, à condition que p lim ) = 
n 


Q, où L, est la matrice de variance et de covariance de u (2, = L,)) et où Q est une 
matrice finie et inversible : 
li AMCO _ 
plim$ = $ (2.20) 


conditionnellement à la valeur réalisée de X et inconditionnellement. Ce résultat 
s'applique évidemment à chaque élément du vecteur estimateur (donc p lim BMCO — 


Bi, p lim BMCO = B, ... plim BMCO = B,),. 


Remarques 


Quand u est un bruit blanc, ce qui implique que Z, = 021,, cette condition se réduit à 


l 


XX 
l'hypothèse que plim (=) = Q est finie et inversible. Cette hypothèse découle elle-même 


de l'hypothèse plus forte que les vecteurs X; sont indépendants et identiquement distribués, 
avec E(X,X!) = Q pour tout t = 1...n. Quant aux hypothèses que E(u) = 0 et Z, = 021,, elles 
découlent elles-mêmes de l'hypothèse plus forte que les u; sont indépendants et identiquement 
distribués avec une espérance O et une variance 02. La combinaison de ces hypothèses plus 
fortes sur X et u est souvent utilisée dans les manuels car elle implique que les variables X:u: 


1. Si, par exemple, le modèle est Y, = B1 + B2X2: + B3YŸ:_1 + w, pour tout f, la variable Y, (pour une période p 
quelconque) se trouve dans le membre gauche à la période p mais dans le membre droit à la période p + 1. Elle 
se trouve donc à la fois dans Y et dans X. Il est alors impossible de raisonner conditionnellement à X puisque 
ce serait aussi raisonner conditionnellement à Y. 


2. Donc E (BHIx) = Pi, E(BNCIx) pe (Be Ix) = By, et si E((X'X)-1X") < 00: E(Bi1c0) = 
BE (BNC) =... (BNC) = pi. 

3. Les éléments diagonaux de L, sont les V(u,) = o?(#) pour t = 1... n, et les éléments « hors diagonale » sont 
les cov(w, us) = v(f,s) pourt,s=1...nett Æ£s. 
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sont i.i.d. avec E(X;w) = 0 et, compte tenu du théorème de Khinchine, que plim (=) = 0. 
n 


Quand on raisonne conditionnellement à la valeur réalisée de X, les hypothèses utilisées sont 


/ X'L,X | X'X 
lim ( }= ao lim (Æ)-e 
n— 00 n n— 00 n 


Interprétation du caractère sans biais de B"C° 


Si on pouvait répéter plusieurs fois l’histoire économique de chaque période t, on aurait 
pour chaque période f plusieurs réalisations différentes xl,x2,... de la variable aléatoire 
univariée X2, plusieurs réalisations différentes, xl,xi, .… de la variable aléatoire univariée 
X3... plusieurs réalisations différentes Mk Xe = ” de la variable aléatoire univariée XH, 
ainsi que plusieurs réalisations différentes y!,y2... de la variable aléatoire univariée Y.. 
On aurait ainsi plusieurs réalisations différentes dre. du processus stochastique X2, 
plusieurs réalisations différentes xl, x3,x3 ... du processus stochastique X3.. plusieurs réali- 
sations difstenies XX» . du processus stochastique Xx, ainsi que plusieurs réalisations 
différentes yl,y,y... du processus stochastique Y. On aurait donc Plusieurs réalisations 


xl,x2,x... de la matrice X, et plusieurs réalisations différentes y!,y?,y*... du vecteur Y. 


On biendioi ainsi plusieurs réalisations MCO' BMCO* BMCO® de fwco, telles que 
fMco’ = (xl) ll pl, Mco® = (2x2) 1 x2/ÿ?, RMCO* = (xx5)-lxŸ y Chacune de ces 
réalisations serait la valeur estimée obtenue lorsqu'on applique la formule de l'estimateur des 
moindres carrés ordinaires aux données d’un échantillon particulier. Le caractère sans biais 
de l'estimateur BMCO implique que toutes ses réalisations différentes fMco' fMco? fMCOi 
seraient distribuées autour d'une valeur moyenne égale à B — le vecteur des valeurs « vraies 
inconnues » que l’on cherche à estimer — et n'implique donc pas que la valeur estimée obtenue 
en pratique pour un seul échantillon particulier soit égale à la valeur « vraie inconnue » du 
vecteur B, ni même qu'elle en soit proche. Le caractère sans biais de l'estimateur garantit 
seulement que la méthode d'estimation utilisée n'a pas une tendance systématique à sous- 
estimer ou à surestimer les coefficients « vrais inconnus ». 


Qu'est-ce qui permet alors d'apprécier la précision de l'estimation d'un coefficient « vrai 
inconnu », obtenue avec la méthode des moindres carrés ordinaires sur un échantillon parti- 
culier? En d'autres termes, comment savoir si la probabilité que la valeur estimée obtenue soit 
« proche » de la valeur « vraie inconnue » du coefficient est forte ou faible? C'est la variance 
de l’estimateur des moindres carrés ordinaires. 


Interprétation du caractère convergent de B"C0 


Si la taille de l'échantillon d'observations (disponibles pour chaque série temporelle) devient 
très grande, la distribution de probabilité de l’estimateur MC n’équivaut plus qu'à un point : 
on ne note plus de différences entre les valeurs estimées obtenues avec des échantillons 
différents. Ce point est précisément la valeur vraie du vecteur B que l’on cherche à estimer. 


Terme d'erreur indépendant des variables explicatives 


et de type bruit blanc 


Aux hypothèses de la section précédente (Terme d’erreur indépendant des variables expli- 
catives), on ajoute l’absence d’hétéroscédasticité et d’autocorrélation du terme d’erreur. 


Si u est bruit blanc — c’est-à-dire si E(u;) = 0  Vf, que V(u) = 0% Vt, et que 
Coviu,, ue) = 0 Vi, VO Æ 0 — et si X;, est indépendant de u,,, Vf = 1...n, VX, 
Vi = 2...k, on garde les propriétés a) et b) de la section précédente, et on a en plus les 


propriétés suivantes : 
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c) Calculée à partir des résidus de l'estimation du modèle par moindres carrés ordinaires, 
/ 


x 2MCO ee : as : 

la formule 6,  — ps est un estimateur sans biais et convergent de la variance 

«vraie inconnue » du terme d’erreur : 

c'e e'e 
E X]=0% et E SE 2.21a 
(- — K! ) é n—k É 
: e'e 
plim = (2.21b) 
n—k 


d) Les estimateurs des moindres carrés ordinaires ont une matrice de variance et de 
covariance non observable, donnée par : 


1 


Ejucox = 04 (XX)! et Sguco = 0E((XX) *) (2.22) 


e) Un estimateur sans biais de cette matrice est fourni par la formule Eguco = 
/ 
e'e 


/ 


x ee —1 
E (ÉsucolX) x: (- : (XX) x) = Djucox (2.23a) 


a e'e _i 

E(Sguco) = E (- — (XX) ) = Ejuco (2.23b) 

f) Parmi tous les estimateurs sans biais de 6 qui sont des fonctions linéaires de la variable 
dépendante, ceux qui utilisent la méthode des moindres carrés ordinaires sont les plus 
précis (c’est le célèbre théorème de Gauss-Markov) : 


Pour tout estimateur B tel que E(BIX) = E(B) = B et tel qu'il existe une matrice A 
vérifiant B = AY, Ex — Egmcol x est une matrice semi définie positive (1), de même 
que D = Zguco. 

g) Les estimateurs de moindres carrés ont une distribution asymptotique normale, incon- 
ditionnellement ou conditionnellement aux valeurs réalisées des variables explicatives. 


Vñ (PE = 6) + N(0,02Q"!) 


X'X 
si plim (=) — Q est finie et de rang plein @) (2.24) 


x 2MCO L M4 
Va (6 . c) SN C (Ë : 1) à) (2.25) 
u 


Les distributions marginales et conditionnelles ont les unes et les autres une distribu- 
tion asymptotique normale. 


1. Cela signifie en quelque sorte que la matrice Zgix est « plus grande » que la matrice Zsmco ,. En effet, si un 
scalaire a est plus grand qu’un scalaire b (on note a > b), il existe nécessairement un scalaire c supérieur à 0 
(c > 0) et tel que a = b + c (par exemple 8 > 3 car 8 = 3 +5 où 5 > 0). On généralise ce raisonnement à des 
matrices : une matrice À est « plus grande » qu’une matrice B s’il existe une matrice C définie positive telle que 
A = B + C. Une matrice C est définie positive si pour tout vecteur x différent de 0, x'Cx > 0. Le théorème de 
Gauss-Markov établit l'efficience relative de l’estimateur de MCO. On ne peut établir l'efficience absolue qu’en 
posant des hypothèses supplémentaires sur la distribution des variables ou du terme d’erreur. 

2. Quand on raisonne conditionnellement aux valeurs réalisées des variables explicatives, donc à la valeur 


n— 00 


1 
réalisée de X, cette condition devient «si lim ( ) = Q est finie et de rang plein ». 
n 
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h) Une fonction de l'écart entre l’estimateur BMCO d’un coefficient et la valeur « vraie 
inconnue » B; de ce coefficient est distribuée asymptotiquement d’après une normale 
centrée réduite, inconditionnellement ou conditionnellement aux valeurs réalisées des 
variables explicatives : 


f»co —p, à 


vi= 1.6 PL x, D (2.26) 
Smco 
où Sjuco est l'écart type estimé de BMCO, et donc la racine carrée du i élément de la 
: e"e = 
diagonale principale de Zimco = a (XX) ke 
n — 


Terme d'erreur indépendant des variables explicatives, de type bruit blanc 
et distribué normalement 


Aux hypothèses de la section précédente (Terme d’erreur indépendant des variables expli- 
catives et de type bruit blanc), on ajoute l'hypothèse de normalité du terme d’erreur. 


Si u est un bruit blanc — c’est-à-dire si E(u,) = 0 Vf, que V(uw) = 0? Vf, que 


Coviu,, ue) = 0 Vf, VO Æ 0 — si X; est indépendant de w,31 Vt = 1...n, VX, 

Vi = 2...k, et si u est normal : u + N(0,0°1,), on garde les propriétés a), b), c), d), e), 

f), g), h) de la section précédente, et on a en plus les propriétés suivantes : 

i) Les estimateurs des moindres carrés ordinaires sont distribués normalement pour 
tout n, conditionnellement à la valeur réalisée de X : 


BMCO D N (6. 0? (xx) conditionnellement à X (2.27a) 


Il s’agit d’une distribution exacte, quelle que soit la taille de l'échantillon, y compris si 
elle est petite. 


Toutefois, ce résultat n’est valable que pour la distribution conditionnelle 
fimcoix (BMcIx). La distribution inconditionnelle, f;uco ET) ne suit pas une 


distribution exacte N (6, o2E (( X'X) ga) sur de petits échantillons, même si le terme 


d’erreur a une distribution normale, mais elle est asymptotiquement normale (c’est un 
résultat qui ne nécessite pas une distribution normale du terme d’erreur). Condition- 
nellement à X, on dispose également d’une distribution exacte sur de petits échantillons 
pour l’estimateur de la variance du terme d’erreur : 


(n — k)6; ee : 
me = (2.27b) 


j) Une fonction de l'écart entre l’estimateur M d’un coefficient et la valeur « vraie 
inconnue » f; de ce coefficient est distribuée d’après une loi de Student pour tout n, 
conditionnellement à la valeur réalisée de X ou inconditionnellement : 

RMCO _ g. 

PE LR Dia (2.28) 

Sguco 


où Sjuco est l'écart type estimé de 8", et donc la racine carrée du 5 élément de la 


diagonale principale de Éuco. Ce résultat est valable quelle que soit la valeur de #. Il 
s’agit bien d’une distribution exacte, même sur de petits échantillons. 
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- R° n—k . 

k) Une fonction, F-statistic — 1-2 =) est distribuée(l) selon une 
F(k— 1,n — k) pour tout n, sous l'hypothèse nulle que tous les coefficients, sauf 
la constante f;, sont nuls, conditionnellement à la valeur réalisée de X ou incondi- 
tionnellement. Ce résultat est valable quelle que soit la valeur de #1. Il s’agit bien d’une 


distribution exacte, même sur de petits échantillons. 
A / A 
(PS EH 6) X'X (pue . 6) (n . k) 
(e'e)k 
F(k,n — k) pour tout n, conditionnellement à la valeur réalisée de X ou incondi- 


tionnellement. Ce résultat est valable quelle que soit la valeur de #. Il s’agit bien d’une 
distribution exacte, même sur de petits échantillons. 


1) Une fonction ) est distribuée selon une 


E1 Modèle linéaire dynamique 


A.1 PRÉSENTATION GÉNÉRALE 


Un modèle linéaire est dit dynamique lorsque les k variables explicatives comprennent 
un ou plusieurs retards de la variable dépendante (le retard d’une variable est la valeur 
de cette variable à une date antérieure à f). Avec m retards de la variable dépendante, le 
modèle linéaire dynamique s’écrit de la manière suivante : 


Ye Bi + BaXx + B3X 3 + + Ben X (me + Br-mer Ver + Pr-mr2 V2 +: 
+ BeŸi-m + uw VN=m+l...n (2.29) 
Yi 
>2 Ym+2 
Cela peut s’écrire : Y = XB + u, où Ÿ — | : 
Yh 
1 X2(m+1) XG-mm+n  Ym Yi Yi 
: 1 X2(m+2) XG-m)Gn+2)  Ym+i  Yn ÿ 
1 Xon X mn Yu Vs Vs 
Bi Um+1 
B2 Um+2 
B — $ U = . 
Br Un 


Y est un vecteur à n — m éléments, X une matrice à n — m lignes et k colonnes, B un vecteur 
à k éléments et 4 un vecteur à n — m lignes. L’estimateur des moindres carrés ordinaires 
de B est de nouveau BMCO = (X'X)-1X'Y. 


1. Une distribution F(k — 1,n — k) est une loi de Fischer à k — 1 degrés de liberté au numérateur et à n — k 
degrés de liberté au dénominateur. 
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A.2 PROPRIÉTÉS STATISTIQUES DE L'ESTIMATEUR DE MCO 


Le terme d’erreur u, d’un modèle linéaire dynamique, à une période spécifique, n’est 
jamais indépendant de toutes les variables explicatives mises en jeu à toutes les périodes. 
Si, par exemple, le modèle exprime, à la période f, la variable dépendante Y, en fonction 
de la variable explicative Y,_:, cette dernière est nécessairement corrélée avec le terme 
d'erreur 4-1 du modèle à la période f — 1. 

Il en résulte que l’estimateur de MCO est nécessairement biaisé. Si le terme d’erreur 
n’est pas autocorrélé, donc s’il s’agit d’un bruit blanc, lestimateur de MCO est toutefois 
convergent ; sinon, il ne l’est pas. 


E Tests de mauvaise spécification du modèle 
5.1  PROBLÉMATIQUE DES TESTS 


On distingue principalement deux types de tests d’hypothèses dans le contexte du modèle 

linéaire : 

+ Ceux qui portent sur les valeurs des coefficients B; ou o, du modèle estimé (voir 
chapitre 3). Ils vérifient des restrictions sur les paramètres du modèle en question. 


+ Ceux qui portent, entre autres, sur l’absence d’autocorrélation ou d’hétéroscédasticité 
du terme d’erreur u, ou sur la constance des coefficients dans le temps, etc. Ils sont 
appelés « tests de mauvaise spécification du modèle » et vérifient généralement des 
restrictions par rapport à un modèle plus général que celui estimé. 


Exemple 


Après avoir estimé un modèle Y, = B: + B2X2; + w, on souhaite tester l'hypothèse d'absence 
d'autocorrélation de u, en vérifiant que p = 0 dans le modèle plus général Y, = B1 + B2X2 +14, 
avec u, = pus_1 + v, où v, est un bruit blanc. 


Qu'il soit du premier type ou du deuxième, tout test est soit exact (on parle alors de 
«test de petit échantillon »), soit asymptotique. Quand il est exact, on connaît la fonction 
de densité, sous l'hypothèse nulle, quelle que soit la grandeur de échantillon utilisé, 
même s’il est petit. Quand il est asymptotique, on ne connaît la fonction de densité, sous 
l'hypothèse nulle, que pour une taille d’échantillon tendant vers l'infini. La fonction de 
densité utilisée pour un test asymptotique n’est donc une bonne approximation de la 
fonction « vraie inconnue » que lorsque l’échantillon est grand. 


Tests exacts 


On ne peut obtenir un test exact qu’en faisant une hypothèse de distribution exacte sur le 

terme d’erreur du modèle. Par exemple, si l’on pose que le terme d’erreur est normalisé 

Eco —$, 
1 


et de type bruit blanc, ty quelle que soit la taille n de l'échantillon. Ce 


âMCO 
résultat fournit un test exact de Phypothèse que B; vaut une valeur particulière. Pour tester 
simultanément un ensemble d’hypothèses linéaires sur plusieurs coefficients du modèle, 
on dispose également de tests qui ont une distribution exacte F lorsque le terme d’erreur 
est normal (voir chapitre 3). 
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Toutefois, pour certaines hypothèses, les tests n’ont pas de distribution connue sur un 
petit échantillon, même si l’on admet la normalité des erreurs. On utilise alors les tests 
asymptotiques. 


Tests asymptotiques 
Test du rapport de vraisemblance 


Pour tester une hypothèse au moyen d’un test du rapport de vraisemblance (dit « LR » 
pour « likelihood ratio »), on est obligé de faire des hypothèses sur la distribution exacte 
des variables aléatoires du problème, de manière à déduire la fonction de vraisemblance. 
Concernant le modèle linéaire, il faut généralement prendre l’hypothèse que west distribué 
normalement. 


L 
La forme générale d’un test LR est À — _. où Lo est la valeur de la fonction de 


1 
vraisemblance maximisée sous l’hypothèse nulle Ho, et Li est la valeur de la fonction 
de vraisemblance maximisée sous l’hypothèse H.. 


Parfois, il est possible de trouver la distribution exacte de À sous l'hypothèse Ho, même 
pour de petits échantillons. C’est en général le cas quand X est une fonction monotone 
croissante d’un test dont on connaît la fonction de densité exacte sous l'hypothèse H6. On 
a alors des valeurs critiques exactes pour tester l'hypothèse H, au moyen du test X. 


Toutefois, le plus souvent, il faut se contenter de la distribution asymptotique de à. On 
montre en effet que, si H, est vraie et si Ho est emboîtée dans H, (c’est-à-dire que, 
sous l’hypothèse Ho, si le modèle est un cas particulier du modèle qui prévaut sous 


l'hypothèse H,), —2 In (à) = x2, où r est le nombre de restrictions que Ho représente sur 
les paramètres du modèle, par rapport à leur statut sous H,. On obtient ce résultat sous 
les conditions de régularité qui sont nécessaires pour garantir la normalité asymptotique 
et l'efficience des estimateurs du maximum de vraisemblance. La distribution n’est pas la 
distribution exacte de —2 In(X) sur un petit échantillon. Si on choisit une valeur critique 
X2_% à est le seuil de signification nominal du test, mais pas le vrai seuil, qui est lui 
inconnu (il correspond à la probabilité de rejeter H, alors qu’elle est vraie, la puissance du 
test P valant par définition un moins la probabilité d'accepter Hs alors qu’elle est fausse, 
donc un moins le risque de deuxième espèce). 


Si est le vecteur des coefficients du modèle, si @ est l’estimateur du maximum de 
vraisemblance sans contrainte, et si @ est l’estimateur du maximum de vraisemblance 
: he 0L 
sous la contrainte Ho, on montre que —2Inx = (@— @) 
209 4-5 


(® — $o) où 
L = L(@) est la fonction de vraisemblance. 


La réalisation d’un test du rapport de vraisemblance exige d’estimer le modèle contraint 
sous Ho, et le modèle non contraint sous H1. L'idée générale du test est la suivante : 
si l'hypothèse H, est vraie, on peut l’imposer à l’estimation avec une faible perte de 
vraisemblance : Lo doit être proche de L:, et donc à doit être à peine plus petit que 1. Par 
conséquent, on rejette H, quand X est bien plus petit que 1, et donc quand —2In(X) est 
trop grand. 


Test de Wald 


Pour tester une hypothèse au moyen d’un test de Wald (ou test W), il suffit d’estimer le 
modèle non contraint, c’est-à-dire sous hypothèse H.. Le principe du test est le suivant : si 
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è ss : 1 Eu 7] 
Hh est vraie, les valeurs estimées des coefficients, obtenues sans imposer H, (doncsous H;), 


doivent approximativement respecter les contraintes qui seraient imposées par H5. On 
rejette donc Hi si les valeurs estimées obtenues librement s’éloignent fortement des 
contraintes représentées par Ho. 


On peut représenter un ensemble de m restrictions linéaires sur les coefficients d’un 
modèle statistique quelconque par l'équation Ro = r, où y est le vecteur des p coefficients 
du modèle. La matrice R a m lignes et p colonnes tandis que le vecteur r a m éléments. 
De manière générale, si un estimateur convergent @ du vecteur de coefficients @ est 


distribué asymptotiquement de la manière suivante : 4/n (@ — +) ZN (0, Z(p) ‘), 
alors n(R$—r) (RZ(e) ! Ro" (R@— r) = x2, sous l'hypothèse Rp = r. Si l’on 
dispose d’une matrice observable © ($) telle que plim 20) —= ZX () et si les hypothèses 
n 
4 ee —] 
Re = r sont vraies, W = (R®— r) (RS (6) '_R) (R@— r) 3 X2,. La statistique W 
est le test de Wald des hypothèses Ro = r. 


Test du multiplicateur de Lagrange 


Pour tester une hypothèse au moyen d’un test du multiplicateur de Lagrange (test 
LM, Lagrange Multiplier), il suffit d’estimer le modèle contraint, c’est-à-dire sous 
l'hypothèse H5. Le principe du test est le suivant : si Ho est vraie et qu'on maximise 
la vraisemblance en imposant H,, les contraintes représentées par cette hypothèse 
induisent une faible perte de vraisemblance : les multiplicateurs de Lagrange associés 
aux contraintes imposées par Ho doivent être proches de 0. On montre que si les 


92L AE 
0 TG) ac 
PI | COLIS 


} Ce test LM est un test du multiplicateur de Lagrange 


L 2 
7 Xm 


hypothèses Ro = r sont vraies, LM = 
p=Ÿ0 

9°L 
090P"|9=50 
des hypothèses Rp = r, au même titre que les tests donnés par la formule ci-dessous, où 
I est remplacé par Î. Pour n'importe quelle matrice Î (Go) asymptotiquement équivalente 


/ 
Ne d°L San NUL 
à I (@), LM — (CE …) I (@o) EE 


Asymptotiquement, LR = W = LM. Il n’en va pas de même pour un petit échantillon. 


Pour des hypothèses sur les coefficients d’un modèle linéaire, on montre que W > LR > 
LM. Donc toute hypothèse rejetée par le test LM est aussi rejetée par les tests LR et W. 


où 1 ($o) = —E 


L_ 2 
Xm- 


g=$0 


5.2 TESTS D’'ABSENCE D'AUTOCORRÉLATION 


Pour vérifier l'absence d’autocorrélation du terme d’erreur #, on dispose de plusieurs 
tests : 


+ Test de Durbin et Watson [DUR 1951] (voir section 9.2). Il ne peut s'appliquer lorsque 
les variables explicatives sont aléatoires [SPA 1986], en particulier lorsque la variable 
dépendante retardée fait partie des variables explicatives : dans ce cas, il est biaisé vers 
l'acceptation de l'hypothèse d’absence d’autocorrélation). 


Tests de mauvaise spécification du modèle A1 


A2 


+ Test de Durbin [DUR 1970]. Il est distribué asymptotiquement comme une N(0, 1) 
sous l’hypothèse d'absence d’autocorrélation du terme d’erreur. Il est applicable quand 
la variable dépendante retardée fait partie des variables explicatives. Il se décline en deux 
versions : le « h normal » et le « h alternatif ». Le premier n’est pas toujours calculable 
(radicand négatif) et s'applique uniquement quand la variable dépendante a un seul 
retard. Le second s'applique même quand elle en a plusieurs. Quand elle n’en a qu'un, 
ces deux versions sont asymptotiquement équivalentes. Toutefois la puissance du «h 
alternatif » peut être très faible sur de petits échantillons [RAY 1994]. 


Test d’autocorrélation de Godfrey [GOD(a) 1978], [GOD(b) 1978]. Il est appli- 
cable dans tous les cas, même quand la variable dépendante retardée fait partie des 
variables explicatives. Dans sa version LM, ce test est noté ici LM“(p) et est distribué 
asymptotiquement comme une ee sous lhypothèse H que le terme d’erreur n’est 
pas autocorrélé (H; correspond à une autocorrélation d’ordre p, autorégressive ou en 
moyenne mobile). Dans sa version F, ce test est noté ici FC(p) et est distribué asymp- 
totiquement comme une F(p, n — k — p), sous l'hypothèse Hs. Les deux versions sont 
équivalentes asymptotiquement. Toutefois, sur de petits échantillons où elles ne sont 
qu'approximativement correctes, elles peuvent aboutir à des conclusions différentes. 
Ces tests sont pré-programmés dans Microfit par exemple. 


Test d’autocorrélation de Breusch et Godfrey [BRE 1981]. Il s’agit d’un test LM qui 
fonctionne comme le test de Godfrey et qui est distribué asymptotiquement comme 
une *. sous l'hypothèse H, que le terme d’erreur n’est pas autocorrélé (H; correspond 
à une autocorrélation d'ordre p, autorégressive ou en moyenne mobile). Ce test est 
pré-programmé dans TSP par exemple. 


Test Q*(p) de Ljung et Box [LJU 1978]. Ce test « portmanteau » est distribué asympto- 
tiquement comme une 1 sous hypothèse d'absence d’autocorrélation d'ordre p du 
terme d’erreur u. Sur de petits échantillons, il semble avoir de meilleures propriétés que 
le test Q(p) de Box et Pierce [BOX 1970] dont il est une modification. 


5.3 TESTS D'HOMOSCÉDASTICITÉ OÙ D'ABSENCE D'HÉTÉROSCÉDASTICITÉ 


Pour vérifier l'absence d’hétéroscédasticité du terme d’erreur w, on dispose de plusieurs 
tests : 


+ Test d’hétéroscédasticité de White [ WHI 1980]. Il est basé sur la régression du résidu 
au carré sur une constante et les produits croisés entre toutes les paires de variables 
explicatives différentes (constante comprise). On teste l'hypothèse nulle que tous les 
coefficients de cette régression sont nuls, sauf le terme constant. Sous cette hypothèse, 
le test est distribué selon une loi Chi-2 à ((k+ 1)k/2) — 1 degrés de liberté. 


+ Test LMhet. Il vérifie l’hypothèse H; d’homoscédasticité (selon H:, le carré du résidu 
dépend du carré de la valeur calculée Ÿ, de la variable dépendante). Sous H5, LMhet est 
distribué asymptotiquement selon une x?. 


+ Test ARCH(p) d’Engle [ENG 1982]. Il vérifie l'absence d’hétéroscédasticité autorégres- 
sive conditionnelle d'ordre p. Sous cette hypothèse nulle d’homoscédasticité, le test est 
distribué asymptotiquement selon une 1 


+ Test LRhet. Il est basé sur une décomposition de l'échantillon global en deux sous- 
ensembles d'observations. Il vérifie lhypothèse Hç d’homoscédasticité du terme 
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d'erreur (selon H;, la variance du terme d’erreur est différente dans chaque sous- 
échantillon). Sous l'hypothèse nulle, le test est distribué asymptotiquement selon 
une x?. 

Test d’hétéroscédasticité de Breusch et Pagan [BRE 1979]. Il fonctionne comme le 
test de White, en permettant d'introduire dans la régression des produits croisés faisant 
intervenir une liste arbitraire de variables. 


NORMALITÉ 


Pour vérifier la normalité du terme d’erreur u, on dispose du test de Jarque et Bera [JAR 
1987] [JAR 1981], qui est valable avec ou sans constante dans le modèle. Sous l'hypothèse 
nulle de normalité du terme d’erreur, ce test est distribué asymptotiquement comme une 
X5. On a tabulé également des valeurs critiques pour les petits échantillons. 


5.5 TESTS DE 


STABILITÉ DES COEFFICIENTS 


Pour vérifier la constance dans le temps des coefficients B; du modèle linéaire, on dispose 
par exemple des tests suivants : 


Premier test de Chow [CHO 1960]. Ce test est connu pour être un test de stabilité 
des coefficients de régression, ou encore un test d'analyse de covariance. Il sépare 
lPéchantillon en deux ensembles de n, et n observations (n — n1 + mn). Selon 
Hh, les coefficients 8 sont les mêmes sur les deux sous-échantillons, et selon H, ils 
sont différents, conditionnellement à l'hypothèse maintenue que la variance du terme 
d'erreur est la même. Il faut estimer le modèle sur l’ensemble des n observations, ce 
qui donne le vecteur de résidus e. Il faut aussi estimer le modèle sur les n1 premières 
observations, ce qui donne le vecteur de résidus e:, et ensuite sur les n observations 
suivantes, ce qui donne le vecteur de résidus e,. Sous H5, on montre que 


Fe - Unit —2k) (ge— éje — 6e) 
k(ele1 + ese:) 


 E(k,n1 + n2 — 2k) 


Cette distribution est exacte pour de petits échantillons, valable à condition que le terme 
\ s L 
d’erreur soit normal. La version LM de ce test est la suivante : sous H6, KP — y. 


Deuxième test de Chow [CHO 1960]. Ce test est connu sous le nom de test d’inaptitude 
à la prévision ou « predictive failure test » en anglais. Il s'emploie lorsque le nombre 
d'observations dans la deuxième partie de l’échantillon est inférieur au nombre de 
coefficients à estimer du modèle (n> < k). Il faut d’abord estimer le modèle sur 
Pensemble des n observations, ce qui fournit le vecteur de résidus eÿ puis estimer le 
modèle sur les n; premières observations, ce qui fournit le vecteur de résidus e;. Sous 
l'hypothèse H d'égalité des coefficients B sur les deux sous-échantillons, 


FCH — (mi — k) (e5eo = ee) 
mn (ée) 


Gi Fm, ni Es k) 


; . L 
La version LM de ce test est la suivante : sous Ho, n2F%4 La 
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5.6 TESTS DE FORME FONCTIONNELLE ADÉQUATE 


Le test Reset de Ramsey [RAM 1969] [RAM 1970] vérifie le caractère adéquat de l’hypo- 
thèse de linéarité en testant l'hypothèse nulle que le carré de la valeur estimée Ÿ, de 
la variable dépendante n’a pas d’influence additionnelle sur la variable dépendante Y.. 
Ce test se décline en deux versions, et donc deux formules de calcul : une version LM 
et une version F. Sous l’hypothèse nulle, il est distribué asymptotiquement selon une 
loi x? en version LM, et asymptotiquement selon une loi F(1, n— k— 1) en version F. On 
peut le généraliser en vérifiant l'effet de plusieurs puissances de Ÿ,, jusqu’à une puissance p. 
Dans ce cas, le test LM est distribué asymptotiquement selon une loi FER et le test F 


selon une loi F(p 1,n—k—(p 1)), sous l'hypothèse nulle [ANS 1961]. 


Résumé 


L'estimation d’un modèle linéaire par la technique des moindres carrés ordi- 
naires est l'outil de base de l’économétrie. Une variable dépendante est modéli- 
sée comme une fonction d’une ou de plusieurs variables explicatives, à laquelle 
s'ajoute un terme d’erreur (une perturbation). Le choix de l’estimateur des 
moindres carrés ordinaires est adéquat lorsque le terme d'erreur du modèle est 
indépendant des variables explicatives. Cette condition garantit un estimateur 
MCO sans biais et convergent. Si le terme d’erreur n’est pas lié linéairement 
à ses valeurs passées, en d’autres termes s’il n'est pas autocorrélé et si sa 
variance est stable (on dit alors qu’il est « homoscédastique », par opposition à 
«hétéroscédastique »), c’est un bruit blanc. Sous cette condition, qui s'ajoute 
à celle d'indépendance, les estimateurs des moindres carrés ordinaires sont les 
plus précis des estimateurs linéaires sans biais. Il faut également que le terme 
d’erreur soit un bruit blanc pour que les formules utilisées par les logiciels 
pour calculer les écarts types des coefficients, donc leur « imprécision », soient 
correctes. La précision de l'estimation d’un coefficient est alors d’autant plus 
élevée que sa statistique f, qui est le rapport entre la valeur estimée et l’écart 
type, est élevée. Si le terme d’erreur est indépendant, de type bruit blanc et 
normal, on connaît la distribution sur de petits échantillons des estimateurs 
des moindres carrés ordinaires. On peut alors tester des hypothèses sur la 
valeur vraie des coefficients, ou calculer des intervalles de confiance pour 
ces coefficients, même avec peu d'observations. En l’absence de normalité du 
terme d’erreur, mais à condition qu’il soit indépendant des variables expli- 
catives et qu'il soit un bruit blanc, on connaît quand même la distribution 
sur de grands échantillons. Elle permet de tester des hypothèses sur la valeur 
vraie des coefficients, ou de calculer des intervalles de confiance pour ces 
coefficients, quand il y a beaucoup d’observations. Comme il est indispensable 
de connaître les propriétés du terme d’erreur pour pouvoir interpréter les 
résultats d'estimation, on utilise des tests formels pour vérifier ces propriétés. 
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EXERCICE | RÉGRESSION LINÉAIRE AVEC EXCEL 


Énoncé 


Estimez un modèle linéaire expliquant le taux de croissance de la consommation réelle 
en fonction du taux de croissance du revenu réel et du taux d'inflation. Les données de 
la consommation à prix constants, du revenu réel et de l’indice des prix, de 1960 à 1994, 
sont contenues dans le fichier USA.XLS téléchargeable sur le site Internet de l'éditeur 
(www.pearsoneducation.fr). Les définitions des variables principales de ce fichier sont les 
suivantes : CT est la consommation à prix constants, Y est le revenu disponible réel, P est 
Pindice des prix de la consommation. Ces estimations sont à réaliser au moyen du logiciel 
Excel. 

Interprétez les résultats : les mouvements systématiques du taux de croissance de la 
consommation sont-ils expliqués par le modèle? Pouvez-vous déterminer siles coefficients 
du modèle sont estimés avec précision? Pouvez-vous tester les deux hypothèses suivantes : 
le taux d'inflation n’a pas d’influence sur la croissance de la consommation et l’élasticité 
de la consommation au revenu est égale à 1 à court terme? 


Les logiciels tableurs comme Excel de Microsoft Office proposent quelques fonctions 
statistiques, dont l'estimation d’une régression linéaire par moindres carrés ordinaires. 
Comme ces logiciels sont très populaires, il est logique de commencer par montrer ce que 
l’on peut faire avec. 


Le fichier de données fourni avec ce livre est un classeur Excel, nommé USA.XLS. Dans 
une feuille de calcul sont disposées des données sur plusieurs variables, pour les années 
1960 à 1994. Chaque variable occupe une colonne, avec son nom en première ligne. La 
feuille de calcul se présente initialement comme à la figure 2.1, page suivante. 


CT est la consommation totale en termes réels, R un taux d’intérêt à long terme, UR un 
taux de chômage, Y le revenu disponible réel, et P l'indice des prix. 


On fait l'hypothèse que le taux de croissance de la consommation réelle est une fonction 
linéaire du taux de croissance du revenu disponible réel et du taux d'inflation. On suppose 
donc que : 

DLC; = Bi + B2DLY; + B3DLP, + u, 
DLC; = In(CT,) — In(CT;_;) — taux de croissance de la consommation réelle. 
DLY, = In(Y,) — In(Y;_,) — taux de croissance du revenu réel. 


DLP, = In(P,) — In(P;_1) — taux de croissance de l’indice des prix. 
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On veut estimer les paramètres B1, B2 et B; de ce modèle « vrai » supposé. On veut 
également vérifier dans quelle mesure ce modèle explique bien les fluctuations de la 
consommation. 


Procédure à suivre 


Il faut d’abord générer, dans la même feuille de calcul du classeur Excel, les transformations 
des données initiales dont vous avez besoin. Ces transformations sont les variables définies 
précédemment. Vous ne pouvez bien sûr les définir qu’à partir de 1961. En ce sens, recopiez 
les dates, à partir de 1961, dans une nouvelle colonne (H) et mettez dans les colonnes 
suivantes (I, J, K) les formules générant les nouvelles variables. À la première ligne, 
inscrivez les noms de ces nouvelles variables. Affichez la partie supérieure de ces colonnes 
avec les formules (voir figure 2.2, page ci-contre). 


Imprimez la partie supérieure de cette feuille de calcul, qui comprend les valeurs de la 

figure 2.3, page ci-contre. 

Pour estimer les paramètres du modèle « vrai » supposé par MCO, déroulez le menu 

Tools ou Outils, puis cliquez sur Data Analysis ou Utilitaire d’analyse. Un nouveau menu 

s'affiche. Cliquez sur Regression ou Régression linéaire. Une boîte de dialogue s’ouvre 

dans laquelle vous allez remplir ou cocher certaines cases. 

1. Dans la case Y-Range ou Plage pour la variable Y, placez la plage de cellules où se 
trouvent les informations (nom et données) de la variable dépendante, en l'occurrence 
11:135 (le logiciel écrit $I$1:$1$35). 

2. Dans la case X-Range ou Plage pour les variables X, placez la plage de cellules où se 
trouvent les informations (noms et données) des variables explicatives, en l'occurrence 
J1:K35. 


3. Cochez la case Labels ou Intitulé présent puisque les noms des variables sont inclus 
dans les plages de cellules en question. 
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4. Cochez la case Confidence Level ou Niveau de confiance si vous souhaitez obtenir une 
interprétation des tests de nullité de chaque coefficient vrai (c’est-à-dire le résultat de 
la comparaison de la statistique f à une distribution de Student à n — k, ici 34 — 3, 
degrés de liberté) à un autre seuil de signification que celui par défaut (une marge de 
95 % à gauche — et de 5 % à droite — signifie « 5 % de chances de rejeter l'hypothèse de 
nullité du paramètre alors qu’elle est vraie »). Ne cochez donc pas cette case si un test 
à 95 % vous satisfait. 
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5. Ne cochez pas la case Constant is 0 ou Intersection à l’origine si une constante figure 
dans le modèle « vrai » supposé, ce qui est le cas ici (B1). 


6. Cochez la case New Worksheet ou Insérer une nouvelle feuille pour que les résultats 
de l’estimation soient mis dans une nouvelle feuille de calcul. 


7. Cochez la case Residuals ou Résidus pour obtenir les valeurs calculées de la variable 
dépendante et les résidus estimés. 


8. Cochez la case Residual plots ou Courbes des résidus si vous voulez obtenir des 
graphiques du résidu en fonction de chaque variable explicative. 


9. Cochez la case Line Fit Plot ou Courbe de régression si vous voulez obtenir un graphique 
des valeurs calculées de la variable dépendante en fonction de ses valeurs observées. 
Cliquez sur OK (voir figure 2.4). 


Figure 2.4 


Régression linéaire 
Paramètres d'entrée 
Plage pour la variable Y: 


Plage pour les variables x: $2$1:$K$35 % 


NV intitulé présent D Intersection à l'origine 
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Options de sortie 


© Plage de sortie: ET 
fe Insérer une nouvelle feuille: [RESULTATS 


© Créer un nouveau classeur 


Analyse des résidus 
D Résidus [ Courbes des résidus 
D Résidus normalisés [ Courbes de régression 


Probabilité normale 
D Diagramme de répartition des probabilités 


Vous obtenez les résultats de l'estimation par MCO dans une nouvelle feuille de calcul, 
RESULTATS, dans le même classeur (voir figure 2.5, page ci-contre). 


Viennent d’abord des résultats descriptifs de la régression. La colonne Coefficients donne 
les valeurs des coefficients estimés par MCO (ici BMCO, BMCO et BMCO), Le calcul de 
la formule de l’estimateur des moindres carrés ordinaires donne les résultats suivants : 
la valeur estimée BMCO de la constante « vraie inconnue » B, vaut 0,016282; la valeur 


estimée 8/00 du coefficient « vrai inconnu » B2 du taux de croissance du revenu DLY vaut 


0,696020; la valeur estimée BMC© du coefficient « vrai inconnu » B; du taux d'inflation 
DLP vaut —0,136783. Ces coefficients estimés sont plausibles économiquement. En effet, 
le taux de croissance de la consommation augmente lorsque le taux de croissance du revenu 
augmente, à taux d'inflation inchangé, et diminue lorsque le taux d'inflation augmente, à 
taux de croissance du revenu inchangé. C’est ce que suggère un raisonnement économique 
a priori. 
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La formule du calcul de ces coefficients estimés, utilisée par TSP, est bien sûr : 


puco 
puco = | fuco | (xx) x 
fMco 
3 
1 DLYa DLPa DLCai 
1 DLYé DLPo DLC6 
où X = | : et Y — 
1 DLYoa DLPo4 DLCo4 


Les valeurs R-squared et Adjusted R-squared sont le R? et le R? ajusté. Le R? est le 
pourcentage de variabilité de la variable dépendante DLC, qui est expliqué par la variabilité 
des variables explicatives DLY et DLP. La variabilité de DLY et de DLP explique 67 % de 
la variabilité de DLC. 


Résultats disponibles 


Les résultats suivants sont également disponibles (ils ne sont valables que si le terme 

d'erreur possède certaines propriétés spécifiques) : 

+ La colonne Erreur-type (Standard Errors en version anglaise) donne les valeurs des 
écarts types estimés par les estimateurs des coefficients. Ces valeurs ne sont valables que 
si le terme d’erreur vrai u est un bruit blanc. 


+ La colonne Statistiques f (t-stats en anglais) donne les valeurs des tests de nullité de la 
valeur vraie de chaque coefficient. En cas du nullité du coefficient vrai, la statistique # 
n’est distribuée selon une loi de Student à n — k degrés de liberté que si le terme d’erreur 
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vrai u est un bruit blanc et distribué normalement ; pour un grand échantillon, le 
caractère bruit blanc de u suffit (la normalité de u n’est pas nécessaire) et la statistique # 
est approximativement distribuée selon une N(0, 1), qui est ce vers quoi tend une 
distribution Student pour beaucoup de degrés de liberté. 


La colonne Probabilité (p-value en version anglaise) permet d’interpréter la statistique f 
d’un coefficient : elle indique la probabilité qu'une réalisation de cette statistique soit 
supérieure à la valeur observée de ladite statistique, lorsque celle-ci est distribuée selon 
une loi de Student, donc lorsque le coefficient vrai est nul. Par exemple, si la valeur 
critique est inférieure à 0,05, on rejette l’hypothèse que ce coefficient est nul car, dans 
ce cas, la valeur réalisée de la statistique f se situe dans une zone de valeurs très peu 
probables ; vraisemblablement, il ne s’agit donc pas d’une loi de Student et le coefficient 
vrai n’est pas nul (s’il l’était, il s’agirait d’une loi de Student, à condition que # soit un 
bruit blanc et normal). L'information donnée par une p-value, pour tester la nullité 
des B;, n’est évidemment valable que si la statistique f est distribuée selon une normale 
lorsque le coefficient vrai est nul, en d’autres termes que si # est un bruit blanc et (au 
moins pour un petit échantillon) normal. 


Les colonnes Limite inférieure pour seuil de confiance = 95 % (Lower 95 %) et Limite 
supérieure pour seuil de confiance — 95% (Upper 95%) donnent les bornes d’un 
intervalle de confiance pour les valeurs possibles de chaque coefficient. Elles ne sont 
valables que si u est un bruit blanc et normal (au moins pour un petit échantillon). 


La valeur Erreur-type (Standard Error) dans les Statistiques de la régression (Regression 
Statistics) est la valeur estimée de l’écart type vrai du terme d’erreur vrai u. Cette valeur 
n’est valable que si le terme d’erreur vrai u est un bruit blanc. 


La valeur F, dans le tableau ANALYSE DE VARIANCE (ANOVA), est un test de nullité 
simultanée de tous les coefficients, sauf de la constante. Lorsque cette hypothèse est 
vraie, la statistique F est distribuée selon une loi de Fischer à k — 1 et n — k degrés de 
liberté, à condition toutefois que soit un bruit blanc et normal. 


La valeur critique de F (Significance F) permet d’interpréter la statistique F : elle indique 
la probabilité qu’une réalisation de cette statistique soit supérieure à la valeur observée 
de ladite statistique, lorsque celle-ci est distribuée selon une loi de Fischer, donc lorsque 
tous les coefficients vrais, sauf la constante, sont nuls. Par exemple, si la valeur critique 
est inférieure à 0,05, on rejette l'hypothèse que tous les coefficients, sauf la constante, 
sont nuls car, dans ce cas, la valeur réalisée de la statistique F se situe dans une zone 
de valeurs très peu probables. Il ne s’agit vraisemblablement pas d’une loi de Fischer et 
les coefficients vrais ne sont pas tous nuls (s’ils l’étaient, il s'agirait d’une loi de Fischer, 
à condition que # soit un bruit blanc et normal). L'information donnée par la valeur 
critique de F, pour tester la nullité des B;, n’est évidemment valable que si la statistique F 
est vraiment distribuée selon une loi de Fischer quand les coefficients vrais sont nuls, 
en d’autres termes que si # est un bruit blanc et normal. 


Remarque 


Sans analyser les résultats de tests d'autocorrélation, d’hétéroscédasticité, de normalité, de 
constance des coefficients, etc., il est impossible de savoir si les hypothèses de bruit blanc 
et de normalité du terme d'erreur sont vérifiées et par là même de déterminer la fiabilité des 
écarts types estimés des coefficients, des statistiques t, de leurs probabilités critiques, des 
bornes des intervalles de confiance, de l'écart type estimé du terme d'erreur, etc. La section 
suivante s'intéresse à de tels tests. 
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EXERCICE 2 RÉGRESSION LINÉAIRE AVEC TSPTM 


Énoncé 


Refaites l’exercice 1, mais cette fois en utilisant le logiciel spécialisé TSP (Times Series 
Processor). TSP est un produit de TSP International (http://www.tspintl.com). 


Données 


Placez les données à utiliser dans un fichier Excel appelé USA.XLS. Ce dernier doit être 

organisé afin de pouvoir être interprété par le logiciel TSP. En d’autres termes, il doit 

respecter les règles suivantes : 

+ Disposez les observations des différentes séries statistiques en colonnes. Chaque série 
temporelle occupe une colonne, avec en première ligne le nom donné à la variable. 

+ Si vous placez une colonne de dates, faites-la figurer en première colonne, en indiquant 
comme nom DATE. 

+ Enregistrez le fichier comme feuille de calcul (peu importe le choix de la version), et 
non comme classeur, dans le répertoire C :\ de votre ordinateur. 

Le fichier USA.XLS contient des séries macroéconomiques pour les États-Unis, sur la 

période de 1960 à 1994. Les variables sont le suivantes : 


CT est la consommation privée à prix constants. 
Y est le revenu disponible réel. 
P est l’indice des prix à la consommation. 


Fonctionnement 


Le logiciel TSP fonctionne sous Windows avec GiveWin. Vous pouvez l'utiliser en mode 
«batch » ou en mode «interactif » : 


+ En mode « batch », il faut d’abord écrire toutes les instructions successives dans un 
fichier. Vous avez le choix entre deux méthodes : 

— Soit vous utilisez l'éditeur WordPad accessible sous Windows. Attention : après la 
saisie, enregistrez le fichier avec l’extension .tsp. Ouvrez ensuite le logiciel GiveWin, 
cliquez sur File puis sur Open Text File, cliquez sur le nom du fichier .tsp puis sur 
Ouvrir (ou bien double-cliquez sur le fichier en question). Une boîte de dialogue 
présentant les instructions s’affiche. 

— Soit vous travaillez directement sous GiveWin. Pour cela, ouvrez GiveWin, cliquez 
sur File, sur New, puis sur Text et saisissez les instructions dans la boîte de dialogue. 
Enregistrez éventuellement le fichier (avec l’extension .tsp) en cliquant sur File puis 
sur Save as. 

Une fois les instructions saisies, toujours sous GiveWin, cliquez sur Modules puis sur 

Run TSP. Les résultats apparaissent dans une nouvelle fenêtre. Au besoin, enregistrez-les 

dans un fichier avec l’extension .out, en cliquant sur File puis sur Save as. 


En mode «interactif », ouvrez GiveWin, cliquez sur Modules, sur Add/Remove Module, 
puis sur Browse. Sélectionnez successivement Disk C :, Program Files, TSP4.5, TSPGW 
et cliquez sur Add. Cliquez de nouveau sur Modules, sur Start TSPGW, puis sur Start 
TSP Session et saisissez les instructions TSP, ligne par ligne, en appuyant sur Entrée à 
chaque fois. Les résultats s'affichent à l'écran après chaque commande lorsque celle-ci 
en produit. 
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Programme 


EAD(FILE="C:\USA.XLS"); 


F 
S 
R 
L 
L 
LP=LOG(P) ; 
S 
D 
D 
D 
D 


Ù 

T 

e 
1 — 


Ù 
[ 
[e) 

© © © © 
Re 
Ù 


LC X DLY W:; 

DLY DLC; 

REGOPT(PVPRINT,STARS ,QLAGS=2,LMLAGS=2) ALL ; 
S 


FREQ A; informe que les données sont de fréquence annuelle (A). Pour des données 
mensuelles, utilisez M, pour des données trimestrielles Q ; pour d’autres fréquences ou des 
données en coupe instantanée, inscrivez N. 

SMPL 60 94; informe que l’échantillon de données va de 1960 à 1994. Tant que cette 
instruction n’est pas remplacée dans le programme par une autre occurrence de SMPL avec 
d’autres dates, TSP réalise toutes les commandes qui suivent, sur la période 1960-1994. 
READ(FILE=*C:\USA.XLS”); lit le fichier de données USA.XLS, qui se trouve dans le 
répertoire C : du disque dur. 

Les instructions qui suivent génèrent, à partir des variables initiales figurant dans le 
fichier de données USA.XLS, d’autres variables qui sont des transformations des variables 
initiales. 

LC=LOG(CT) ; génère le logarithme de la variable CT, pour toutes les dates de l'échantillon 
en cours. Cette nouvelle variable se nomme LC. 

LY=LOG(Y) ; génère le logarithme de la variable Y, pour toutes les dates de l'échantillon 
en cours. Cette nouvelle variable se nomme LY. 

LP=LOG(P) ; génère le logarithme de la variable P, pour toutes les dates de l'échantillon 
en cours. Cette nouvelle variable se nomme LP. 


SMPL 61 94; modifie la période sur laquelle les instructions qui suivent doivent être 
réalisées. Celles-ci génèrent des variations des logarithmes des variables, et donc des taux 
de croissance. Ce calcul nécessite, pour chaque date, le logarithme de la variable à la 
période précédente : on ne peut donc commencer qu’en 1961. 


DLC=LC-LC(-1); calcule la variation logarithmique, donc le taux de croissance, de la 
consommation. Cette nouvelle variable se nomme DLC. 

DLY=LY-LY(-1); calcule la variation logarithmique, donc le taux de croissance, de Y 
(revenu disponible). Cette nouvelle variable se nomme DLY. 

DLP=LP-LP(-1) ; calcule la variation logarithmique, donc le taux de croissance, de l’indice 
des prix à la consommation, soit le taux d'inflation. Cette nouvelle variable se nomme DLP. 
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PLOT DLC; produit le graphique de DLC en fonction du temps. 
PLOT DLY; produit le graphique de DLY en fonction du temps. 
PLOT DLP; produit le graphique de DLP en fonction du temps. 
PLOT DLC X DLY W; produit le graphique de DLC et de DLY en fonction du temps. DLC 


est tracé sur l’axe des X et DLY sur l’axe des W. 
GRAPH DLY DLC: produit le graphique de DLC en fonction de DLY. 


Les instructions qui suivent ont pour but d’estimer le modèle « vrai » supposé : 


DLC: = Bi + B2DLY, + BsDLP, + 
et donc de calculer par la formule des moindres carrés ordinaires le modèle estimé : 
DEC = pACO ÉMCODIY, 4 PMCODEP. he. 


Les coefficients estimés B}1C0, BMCO et BMCO sont les valeurs estimées des coefficients 
«vrais inconnus » B1, B2 et B3, à calculer à l’aide de la formule de l’estimateur de moindres 
carrées ordinaires. 


REGOPT(PVPRINT, STARS, QLAGS=2, LMLAGS=2) ALL; demande à TSP de donner, à 
Poccasion des estimations fournies ultérieurement par l’instruction OLSQ, les résultats de 
tous (ALL) les tests. Grâce à PVPRINT, la probabilité critique (p-value) sera mentionnée à 
côté de chaque test. STARS informe sur l’éventuel rejet de l’hypothèse nulle correspondant 
au test. QLAGS=2 exécutera le test « portmanteau » d’autocorrélation de Ljung et Box, pour 
un retard allant jusqu’à 2 périodes. LMLAGS=2 exécutera le test LM d’autocorrélation de 
Breusch et Godfrey, également pour un retard allant jusqu’à 2 périodes. 

NOPLOTS; demande à TSP de ne pas fournir de graphiques des résidus, etc, dans les 
résultats de l’instruction OLSQ qui suit. 

OLSQ DLC C DLY DLP; estime par la formule des moindres carrés ordinaires une fonc- 
tion de régression où DLC est la variable dépendante, C le nom réservé de la constante, 
DLY et DLP les variables explicatives. 


Les principaux extraits des résultats sont les suivants : 


Current sample: 1961 to 1994 
Equation 1 


Method of estimation = Ordinary Least Squares 


Dependent variable : DLC 
Current sample : 1961 to 1994 
Number of observations : 34 


Mean of dependent variable = .031883 
Std. dev. of dependent var. = .016602 
Sum of squared residuals = .294985E-02 
Variance of residuals = .951563E-04 
Std. error of regression = .975481E-02 
R-squared = .675683 
Adjusted R-squared = .654759 
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Durbin-Watson statistic = 1.95346 
Breusch/Godfrey LM : AR/MAI = .111487E-02 [.973] 
Breusch/Godfrey LM : AR/MA2 = .113874 [.945] 
Ljung-Box Q-statisticl = ./766268E-02 [.930] 
Ljung-Box Q-statistic2 = .314195 [.855] 
Wald nonlin. ARI vs. lags = 1.40663 [.495] 
ARCH test = .977662 [.323] 
CuSum test = .628328 [.363] 
CuSumSq test = .106658 [1.00] 
Chow test = .586376 [.629] 
LR het. test (w/ Chow) = -.934652 [1.00] 
White het. test = 2.78845 [.733] 
Jarque-Bera normality test = .733369 [.693] 
F-statistic (zero slopes) = 32.2927 xx [.0001] 
Akaike Information Crit. = -6.33802 
Schwarz Bayes. Info. Crit. = -9.04121 
Log of likelihood function = 110.746 
Estimated Standard 
Variable Coefficient Error t-statistic P-value 
C .016282 .642484F-02 2.53418 : [.017] 
DLY .696020 12155 6.20590 *x  [.000] 
DLP -.136783 .082009 -1.667/91 [.105] 
Variance Covariance of estimated coefficients 
C DLY DLP 
6 0.000041279 
DLY -0.00058796 0.012579 
DLP -0.00043960 0.0042425 0.0067254 
Correlation matrix of estimated coefficients 
C DLY DLP 
C 1.0000 
DLY -0.81596 1.0000 
DLP -0.83433 0.461726 1.0000 


Analyse des résultats de la régression linéaire : 


les résultats descriptifs de la régression 


Il s’agit ici de résultats descriptifs de la régression, purement algébriques, dont la validité ne 
dépend pas de la véracité de certaines hypothèses de départ sur le modèle « vrai » supposé, 
et en particulier sur le terme d’erreur. Ils découlent mécaniquement de Papplication de 
la formule des MCO aux séries de données, indépendamment de toute interprétation 


statistique. 


Valeurs estimées des coefficients (Estimated Coefficient). La valeur estimée pMco de 
B1 vaut 0,016282. La valeur estimée BC de B; vaut 0,696020. La valeur estimée 84100 


de B3 vaut —0,136783. 
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Moyenne empirique de la variable dépendante (Mean of Dependent Variable). C’est 
la moyenne des valeurs de la série DLC sur l'échantillon de 1961 à 1994 utilisé pour 


94 

D. DIG 
la régression : DLC = du + C’est une valeur estimée de l’espérance de cette 
variable. 


Écart type empirique de la variable dépendante (Std. Dev. of Dependent Var.). C’est 
l'écart type estimé de la série DLC sur l'échantillon de 1961 à 1994 utilisé pour la régression: 


94 2 
SpLc = [Es (PLC: : DLC) 


34 — 1 
carrée de la variance, de cette variable. 


. C’est une valeur estimée de l’écart type, ou racine 


Somme des carrés des résidus (Sum of Squared Residuals). C’est e%, + ef, ++: + 34, 
soit la somme des carrés e/e minimale à laquelle il est possible d’arriver. 


Le R au carré (R-squared). C’est le pourcentage de variabilité de la variable dépendante 
DLC, en l’occurrence 67 %, qui est expliqué par la variabilité des variables explicatives 
DLY et DLP. 


Le R au carré ajusté (Adjusted R-squared). C’est une variante du R?, aménagée de 
manière à n'augmenter que si l'ajout d’une variable explicative supplémentaire induit 
une baisse « suffisante » de la somme des carrés des résidus (le R? traditionnel augmente 
systématiquement si l’on ajoute une variable explicative supplémentaire au modèle et 
qu’on le ré-estime). 


Analyse des résultats de la régression linéaire : les tests de certaines 
hypothèses de départ sur le modèle vrai supposé 


Il s’agit de résultats de tests de certaines hypothèses de départ sur le modèle « vrai » 
supposé, et en particulier sur le terme d’erreur. Ces hypothèses doivent être vérifiées pour 
que les résultats de la troisième catégorie soient corrects ou fiables. 


On commence par vérifier l'hypothèse que le terme d’erreur vrai est un bruit blanc, 
c’est-à-dire qu’il n’est ni autocorrélé, ni hétéroscédastique. Puis, on teste l’hypothèse de 
normalité, c’est-à-dire d’une distribution normale, du terme d’erreur vrai. Ensuite, on 
vérifie l'hypothèse de constance des coefficients « vrais inconnus » (ou hypothèse de 
stabilité paramétrique), c’est-à-dire que les coefficients « vrais inconnus » 61, B2 et B3 sont 
vraiment les mêmes à toute période. 


1) Tests d’autocorrélation. Il s’agit de vérifier l'hypothèse d'absence d’autocorrélation 
du terme d’erreur vrai u. Puisqu’il n’est pas observable, les différents tests disponibles 
pour vérifier cette hypothèse se fondent sur les résidus calculés e. La tâche n’est pas 
facile, car même en l’absence d’autocorrélation de u, e est quand même autocorrélé (1). 
La détermination des formules de bons tests d’absence d’autocorrélation de u est donc 
un exercice sophistiqué pour les mathématiciens statisticiens. Le logiciel TSP calcule 
plusieurs de ces tests. 


+ Test du Durbin et Watson. Il n’est valable que si la variable dépendante retardée 
n’est pas incluse dans les variables explicatives, ce qui est le cas dans cette application 
(DLC;-\ ne figure pas parmi les variables explicatives). 


1. En effet e — Mu. Si u est un bruit blanc, ce qui implique entre autres l'absence d’autocorrélation, 2, = o21,. 
Donc la matrice de variance et de covariance de e est Z, = ME,M' = Mo?l,M' = 6MI,M' = o6,MM'o2M 
qui n’est pas une matrice diagonale : e est donc autocorrélé. 
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Dans une table du test de Durbin et Watson, on trouve, en fonction des valeurs de k 
(ici 3) et de n (ici 34) des valeurs critiques dL et dU, pour un seuil critique de 5 % ou 
de 2,5 %, au choix de l’analyste. On calcule alors 4 — dL et 4 — AU et on interprète 
le test. Si la valeur calculée du test est inférieure à dL, on adopte l’hypothèse d’une 
autocorrélation positive du terme d’erreur vrai u. Si elle est située entre dL et dU, 
ou entre 4 — dU et 4 — dI, on ne peut se prononcer; si elle est supérieure à 4 — dE, 
on choisit hypothèse d’une autocorrélation négative ; si elle est située entre dU et 
4 — dU, on ne rejette pas l'hypothèse d'absence d’autocorrélation du terme d’erreur 
Vrai u. 


Pour n = 34 et k = 3, les tables de Durbin et Watson indiquent les valeurs critiques 
dL = 1,33 et dU = 1,48. On en déduit l’absence d’autocorrélation de u. 


Tests Q de Ljung et Box jusqu’à 2 retards. Un test Q(i) de Ljung et Box vérifie 
Phypothèse nulle H, que le terme d’erreur vrai u, n’est lié linéairement à aucune deses 
1 valeurs précédentes : Cov(u,, u;_1) = 0, Cov(u,, u;_2) = 0...Cov(u,u, ;) = 0. 


Le logiciel calcule ici les tests Q(1) et Q(2). L'hypothèse nulle H5 de Q(1) est l'absence 
d’autocorrélation du premier ordre de u (Cov(u;, u;_1) = 0) et l'hypothèse nulle 
Ho de Q(2) est l'absence d’autocorrélation du premier ordre et du second ordre de 
u (Cov(u, u;_1) = 0 et Cov(u,, u;_2) = 0). 

Sous l’hypothèse nulle d’autocovariances nulles ou autocorrélations nulles (ou 
absence d’autocorrélation du terme d’erreur), le test Q(i) est distribué comme une 
Chi-2 à i degrés de liberté. On rejette l'hypothèse nulle si la valeur observée de Q(r) 
est supérieure à la valeur critique d’une table de Chi-2 à j degrés de liberté, pour un 
seuil de signification donné (par exemple 5 %), en d’autres termes si la probabilité 
critique du test Q(i) est inférieure au seuil critique choisi (par exemple 0,05). Ici, 
on ne rejette pas l’hypothèse d'absence d’autocorrélation du terme d’erreur puisque 
0,930 © 0,05 et 0,855 © 0,05. 


Test LM de Breusch Godfrey jusqu'à 2 retards. Un test LM‘“(i) de Breusch 
Godfrey vérifie l'hypothèse nulle H, que le terme d’erreur vrai u, n’est lié linéai- 
rement à aucune de ses j valeurs précédentes : Cov(u,, u;_1) = 0, Cov(u,, u-_2) = 
0...Cov(u,, uy_;) = 0. 

Le logiciel calcule ici les tests LM‘ (1) et LM®" (2). L'hypothèse nulle Ho de LM“ (1) 
est l’absence d’autocorrélation du premier ordre de u (Cov(u:, u_1) = 0) et l’hypo- 
thèse nulle H9 de LM““ (2) est l’absence d’autocorrélation du premier ordre et du 
second ordre de u (Cov(u,, u;_1) = 0 et Cov(u, u;_2) = 0). 


Sous l'hypothèse nulle d’autocovariances nulles ou autocorrélation nulles (ou 
absence d’autocorrélation du terme d’erreur), le test LM“ (i) est distribué comme 
une Chi-2 à i+k—1 degrés de liberté. On rejette hypothèse nulle si la valeur observée 
de LM‘ (i) est supérieure à la valeur critique d’une table de Chi-2 à + k — 1 degrés 
de liberté, pour un seuil de signification donné (par exemple 5%), en d’autres 
termes si la probabilité critique du test LM‘ (5) est inférieure au seuil critique choisi 
(par exemple 0,05). Ici, on ne rejette pas l'hypothèse d'absence d’autocorrélation du 
terme d’erreur puisque 0,973 > 0,05 et 0,945 > 0,05 


2) Tests d’hétéroscédasticité. Il s’agit de tester l'hypothèse d'absence d’hétéroscédasticité 


du terme d’erreur u, c’est-à-dire que la variance du terme d’erreur vrai est la même à 

toute période. 

+ Test de White. Sous l'hypothèse nulle d’absence d’hétéroscédasticité (dépendance de 
la variance de u aux valeurs des variables explicatives), le test White het est distribué 
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selon une Chi-2 à ((k+ 1)k/2) — 1 degrés de liberté. On rejette l'hypothèse nulle si 
la valeur observée du test de White het est supérieure à la valeur critique d’une table 
de Chi-2 à ((k+ 1)k/2) — 1 degrés de liberté, pour un seuil de signification donné 
(par exemple 5 %), en d’autres termes si la probabilité critique du test White het est 
inférieure au seuil critique choisi (par exemple 0,05). Ici on ne rejette pas l'hypothèse 
d'absence d’hétéroscédasticité puisque 0,733 > 0,05. 


Test LR het w/Chow. Sous l’hypothèse nulle d’absence d’hétéroscédasticité (égalité 
de la variance de u sur deux sous-parties de l’échantillon), le test LR het w/Chow est 
distribué selon une Chi-2 à 1 degré de liberté. On rejette l'hypothèse nulle si la valeur 
observée du test LR het w/Chow est supérieure à la valeur critique d’une table de 
Chi-2 à 1 degré de liberté, pour un seuil de signification donné (par exemple 5 %), 
en d’autres termes si la probabilité critique du test LR het w/Chow est inférieure au 
seuil critique choisi (par exemple 0,05). Ici on ne rejette pas l’hypothèse d’absence 
d’hétéroscédasticité puisque 1,00 > 0,05. 

+ Test ARCH. Sous l'hypothèse nulle d'absence d’hétéroscédasticité autorégressive du 
premier ordre (voir chapitre 7 sur les modèles ARCH et GARCH), le test LR het 
ARCH est distribué selon une Chi-2 à 1 degré de liberté. On rejette l'hypothèse nulle 
si la valeur observée du test ARCH est supérieure à la valeur critique d’une table 
de Chi-2 à 1 degré de liberté, pour un seuil de signification donné (par exemple 
5%), en d’autres termes si la probabilité critique du test ARCH est inférieure au 
seuil critique choisi (par exemple 0,05). Ici on ne rejette pas l’hypothèse d’absence 
d’hétéroscédasticité autorégressive puisque 0,323 > 0,05. 


Tests de normalité. On vérifie ensuite l'hypothèse de normalité du terme d’erreur 
vrai u. 


- Test de normalité de Jarque et Bera. Il vérifie l'hypothèse nulle de normalité de u : 
u — N(...). Sous Hh, le test de Jarque et Bera est distribué selon une Chi-2 à 2 degrés 
de liberté. On rejette l’hypothèse nulle si la valeur observée de Jarque et Bera est 
supérieure à la valeur critique d’une table de Chi-2 à 2 degrés de liberté, pour un 
seuil de signification donné (par exemple 5 %), en d’autres termes si la probabilité 
critique du test de Jarque et Bera est inférieure au seuil critique choisi (par exemple 
0,05). Ici on ne rejette pas l'hypothèse de normalité de u puisque 0,693 > 0,05. 

Tests de constance des coefficients. On vérifie ensuite l'hypothèse de constance des 
coefficients « vrais inconnus ». On vérifie donc l’hypothèse que les coefficients vrais 
inconnus f1, B2 et B; sont vraiment les mêmes en toute période. 


+ Test de Chow. Sous l’hypothèse nulle de stabilité des coefficients (égalité des coef- 
ficients sur deux sous-parties de l'échantillon), le test de Chow est distribué selon 
une Fischer à k degrés de liberté au numérateur et n — 2k degrés de liberté au 
dénominateur. On rejette Ho si la valeur observée de Chow est supérieure à la valeur 
critique d’une table de Chi-2 à 1 degré de liberté, pour un seuil de signification 
donné (par exemple 5 %), en d’autres termes si la probabilité critique du test de 
Chow est inférieure au seuil critique choisi (par exemple 0,05). Ici, on ne rejette pas 
Phypothèse de stabilité des coefficients puisque 0,629 > 0,05. 


Test Cusum (Cumulated Sum of Residuals). Sous l'hypothèse nulle de stabilité 
des coefficients (égalité des coefficients sur deux sous-parties de l’échantillon), le 
test Cusum est distribué selon une distribution spéciale de Durbin [DUR 1971].On 
rejette Ho si la valeur observée du test Cusum est supérieure à la valeur critique d’une 
table de la distribution spéciale, pour un seuil de signification donné (par exemple 
5%), en d’autres termes si la probabilité critique du test Cusum est inférieure au 
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seuil critique choisi (par exemple 0,05). Ici, on ne rejette pas l'hypothèse de stabilité 
des coefficients puisque 0,363 > 0,05. 


Test Cusumsq (Cumulated Sum of Squared Residuals). Sous l'hypothèse nulle de 
stabilité des coefficients (égalité des coefficients sur deux sous-parties de l’échan- 
tillon), le test Cusumsq est distribué selon une distribution spéciale de Durbin [DUR 
1969]. On rejette H, si la valeur observée du test Cusumsq est supérieure à la valeur 
critique d’une table de distribution spéciale de Durbin de 1969 [DUR 1969] pour un 
seuil de signification donné (par exemple 5 %), en d’autres termes si la probabilité 
critique du test Cusumsq est inférieure au seuil critique choisi (par exemple 0,05). 
Ici on ne rejette pas l’hypothèse de stabilité des coefficients puisque 1,000 > 0,05 


Analyse des résultats de la régression linéaire : les résultats 
qui ne sont corrects ou fiables que sous certaines hypothèses 
sur le modèle vrai supposé 


Il s’agit de résultats corrects ou fiables dont la validité est conditionnelle à la véracité de 
certaines hypothèses de départ sur le modèle « vrai » supposé, et en particulier sur le terme 
d’erreur. Ces hypothèses ont été vérifiées à travers Les résultats de la deuxième catégorie. 


Écarts types estimés des coefficients estimés. Il s’agit des Standard Errors fournis par le 
logiciel TSP à côté des coefficients estimés (Estimated Coefficients). Ce sont les valeurs 
estimées des écarts types « vrais inconnus » des estimateurs BMC0 des coefficients « vrais 
inconnus » f;. Ce sont les éléments diagonaux de la matrice de variance et de covariance 
estimée des coefficients estimés, calculée par la formule : 


À e"e “ 
Zguco — (3 = :) (XX) : 


Cette formule n’est valable que si le terme d’erreur est un bruit blanc, donc s’il n’est ni 
autocorrélé ni hétéroscédastique. C’est en effet sous ces hypothèses que la formule de 


A 


Zguco, utilisée par les logiciels, est obtenue mathématiquement. 


Matrice de variance et de covariance estimée des coefficients estimés. Toutes les valeurs 
de la matrice sont présentées dans le tableau Variance Covariance of Estimated Coeffi- 
cients. Il n’y figure que la diagonale principale et le triangle inférieur gauche de la matrice 
parce que celle-ci est symétrique (son triangle supérieur droit est la transposée de son 
triangle inférieur gauche). 

Écart type estimé du terme d’erreur vrai. Il s’agit du résultat Standard Error of Regression 
fourni par le logiciel. C’est la valeur estimée 6, de o,, calculée d’après la formule de 

/ 


A 


l’estimateur sans biais 62 de 0? : 67 = Ter. Cette formule n’est valable que si le terme 


d’erreur est un bruit blanc, donc s’il n’est ni autocorrélé ni hétéroscédastique. C’est en 
effet sous ces hypothèses que la formule de 6° est obtenue mathématiquement. 


2 


Statistiques t. Les t-stats sont le rapport entre le coefficient estimé et l’écart type estimé 
de lestimateur du coefficient. En termes des résultats de TSP, chaque statistique t est donc 
le rapport entre l’Estimated Coefficient et le Standard Error. 


À MCO 
B; 


t-stat; — 
jco 


Très utilisé, la statistique f d’un coefficient permet de vérifier l'hypothèse, importante, 
que sa valeur « vraie inconnue » $; est nulle. Mais ce test n’est valable que si le terme 
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d’erreur est vraiment un bruit blanc (ni autocorrélé ni hétéroscédastique), et si l’un des 
deux points suivants est vrai : 


+ Soit le terme d’erreur vrai u est réellement normal, auquel cas on peut tester l’hypothèse 
pour n'importe quelle taille d’échantillon (même si elle est petite), en comparant la 
valeur du test à la valeur critique d’une f,_} à un seuil de signification donné (le plus 
souvent 5 %, 1 % ou 10 %). 


+ Soit le terme d’erreur vrai u n’est pas distribué selon une normale, maïs l’échantillon 
est grand ; dans ce cas, on peut tester approximativement l'hypothèse, en comparant la 
valeur du test à la valeur critique d’une N(0, 1). 


Le test de la statistique f s’utilise ainsi : on sait que pour la valeur « vraie inconnue » 
BMCO 6; At | Pie 
B;, Re est distribué selon une loi de Student f,_x (propriété statistique 8 des 
Bi 

estimateurs de MCO si u est indépendant de X, de type bruit blanc et normal). Donc, si 
la valeur vraie B; = 0, t-stat; (la statistique t de B;) est distribuée selon une loi de Student 
t,_4. Pour vérifier que B; = 0, il suffit donc de s’assurer de la distribution de la statistique t 
de B;. Pour cela, on regarde si l’unique réalisation que l’on en a, fournie par le logiciel 
(colonne t-stat ou t-ratio), a une valeur acceptable pour une variable distribuée selon 
une loi de Student f,_£. On trouve dans les tables de la Student f,_; une valeur critique 
vcs® ; cela signifie qu'une variable f,_; n’a que 5 chances sur 100 de se réaliser à une 
valeur supérieure à vcs%. Si la valeur absolue de la valeur réalisée observée de la t-stat; 
est supérieure à vc5%, on en déduit que la t-stat; n’est vraisemblablement pas distribuée 
selon une f,_+ (puisqu’elle s’est réalisée dans une zone de valeurs peu probables pour une 
loi de Student f,_£) et que ; n’est vraisemblablement pas égal à 0 (sil l'était, f-stat; serait 
forcément distribuée par une f,_#). Donc, si la valeur absolue de f,_= est supérieure à 
VC», on rejette l'hypothèse H, que B; = 0. Si la valeur absolue de f,_} est inférieure à 
VCs%, On ne la rejette pas. 


Il faut donc disposer d’une table de distribution Student pour faire ce type de test. 
La plupart des logiciels ont ces tables en mémoire et peuvent interpréter le test pour 
Putilisateur. Au lieu de donner la valeur critique issue de la table de f,_4, les logiciels 
comme TSP, E-VIEWS, Easyreg et Microfit donnent la probabilité critique de la valeur 
observée du test f-stat;, c’est-à-dire la probabilité qu’une variable f,_} ait une réalisation 
supérieure à la valeur observée du test t-stat; si celle-ci est supérieure à 0, ou inférieure à 
la valeur observée du test t-stat; si celle-ci est inférieure à 0. Si cette probabilité critique 
est inférieure (respectivement supérieure) à 0,05, cela implique forcément que la valeur 
absolue de la valeur observée du test t-stat; est supérieure (respectivement inférieure) à 
la valeur critique vc5, ; on rejette alors l'hypothèse nulle (respectivement, on ne la rejette 
pas). Ici, on rejette l'hypothèse B: = 0, mais non les hypothèses B; = 0 etfB3 = 0. 


Bien sûr, la fiabilité du test n’est pas parfaite : B; étant vraiment égal à 0 et la t-sfat; étant 
donc vraiment distribuée selon une f,_4, sa valeur réalisée a quand même 5 chances sur 
100 d’être supérieure à vc0,05. En pareil cas, on rejette l'hypothèse alors qu’elle est vraie : 
c’est l'erreur de première espèce. En utilisant un seuil de signification de 5 %, la probabilité 
de faire cette erreur est de 0,05. On peut diminuer ce risque en choisissant plutôt la valeur 
critique vcooi : on n’a plus que 1 chance sur 100 de rejeter l'hypothèse nulle alors qu’elle 
est vraie. D’un autre côté, quand on rejette moins souvent l'hypothèse, on augmente la 
probabilité de l’autre type d’erreur possible : celle de ne pas rejeter l'hypothèse alors qu’elle 
est fausse ! 
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Par ailleurs, si l’on sait précisément, une fois le seuil critique choisi, quelle est la probabilité 
du type d’erreur de première espèce (rejet d’une hypothèse vraie), on ne sait généralement 
pas quelle est la probabilité de l’autre type d’erreur (« non-rejet » d’une hypothèse 
fausse). 


On peut donc dire « On rejette l'hypothèse H5 avec 95 chances sur 100 de ne pas se 
tromper », mais il faut absolument éviter des phrases du type de « On ne rejette pas (ou 
on accepte) l'hypothèse H, avec 95 chances sur 100 de ne pas se tromper » qui n’ont 
aucun sens. Tout ce que l’on sait en effet, c’est que l’on a 95 chances sur 100 de ne 
pas faire l'erreur de première espèce, mais l’on ne sait généralement pas quelle est la 
probabilité de faire l’erreur de deuxième espèce. Quand on ne rejette pas une hypothèse 
(donc quand on l’accepte), on ne sait pas quel est le pourcentage de chances de ne pas se 
tromper. 


Important 


Si on ne rejette pas l'hypothèse que B; = 0, cela ne veut pas dire qu'on est certain que 
B; = 0. Cela signifie simplement que O fait partie des valeurs vraies possibles de B; parmi 
toutes les autres valeurs qui ne sont pas rejetées par un test d'hypothèse similaire (voir plus 
loin}. Quand on n'écarte pas l'hypothèse que B; = 0, on peut vérifier que d'autres valeurs 
positives et négatives, autour de O, ne sont pas rejetées non plus par un test d'hypothèse. En 
fait, avant l'estimation d'une équation, on ignore la valeur des coefficients « vrais inconnus », 
alors qu'après, on connaît un ensemble réduit de valeurs qui ne sont pas rejetées par un 
test d’'hypothèse (à un seuil critique arbitrairement fixé] : c'est l'intervalle de confiance. En 
d'autres termes, quand on n'écarte pas l'hypothèse que B; = 0, l'analyse permet de réduire 
faiblement l'ignorance initiale sur la valeur vraie du coefficient B; puisque l'on ne sait toujours 
pas s’il est nul, négatif ou positif. 


L'élasticité de la consommation au revenu est-elle égale à 1 à court terme? 


Cette question revient à demander si B; est égal à 1. On sait que, pour la valeur « vraie 

q 8 que, P 

BMco — B; 
1 


: î à ë : L 
inconnue » de B;,  t,-K si le terme d'erreur u est un bruit blanc, indépendant 


Simco 
Bi 
de X et distribué normalement. Dans le cas où le terme d’erreur u a une autre distribution, 
mais est quand même un bruit blanc, indépendant de X, on sait que pour une grande 
RMCO _ p. 
taille n d’échantillon : He  N(0,1). Ces résultats permettent de tester toutes 
paie 
les hypothèses souhaitées sur la valeur vraie d’un coefficient B;, pour n'importe quel 
i = 1...k. On peut tester par exemple l'hypothèse que B; = 1. On sait que si elle est 
Mco L 
l 


vraie (siB; = 1),  t,-+. Pour vérifier ce qu’il en est, il suffit donc de s’assurer 


Spmco 
1 
Mco A 
que ae + t-K. On trouve dans une table de f,_4 une valeur critique vcso, telle 
gMco 
qu'une variable aléatoire f,_4 a 95 chances sur 100 d’être inférieure à vc5% et seulement 
ÂMCO _ ] 


1 


5 chances sur 100 de la dépasser. Si la valeur calculée de est supérieure à la 


Fi 
valeur critique vc5% (de la table de la distribution f,_z) à un seuil de signification de 5 % 
BMCO __] 
(par exemple), on rejette l'hypothèse que  —  t,-K et donc que B; = 1. On pense 
BMco 
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en effet que s’est réalisé dans une zone peu probable (seulement 5 chances 


Ssmco 

Bi 
sur 100) pour une distribution f,_} et donc qu’il n’est pas vraisemblable pas que B; = 1; 
l'hypothèse B; = 1 est vraisemblablement fausse. 


Encore une fois, si l’on ne rejette pas l’hypothèse que B; = 1, cela ne veut pas dire qu’on est 
certain que fi; — 1. Cela signifie simplement que 1 fait partie des valeurs vraies possibles 
de B; parmi toutes les autres valeurs qui ne sont pas rejetées par le test d’hypothèse. 
0,696020 — 1 
0,112155 
valeur supérieure à la valeur critique à 5 % d’une distribution f34-3. 


BMco =iT 
Ici, on rejette l’hypothèse 8; = 1 car | 2 : 
Sgmco 


| = 2,71, qui est une 


Au lieu d'utiliser manuellement les tables, on peut automatiser la procédure pour que 
TSP vérifie l'hypothèse en calculant la probabilité critique de la valeur calculée du test 
précédent. Pour cela, il faut ajouter les instructions suivantes au programme, juste après 
Pinstruction OLSQ : 


SE TEST=(@COEF(2)-1)/@SES(2); 
SET DFT=@NOB-@NCID; 
CDF(T,DF=DFT) TTEST; 


E-statistic (zero slopes). Il s’agit du test de hypothèse B2 = B3 — 0. On rejette cette 
hypothèse au seuil de 5 % parce que la probabilité critique associée (entre []) est inférieure 
à 0,05. 


EXERCICE 3 RÉGRESSION LINÉAIRE AVEC SPSS 


Énoncé 


Refaites l'exercice 1 en utilisant le logiciel SPSS (le site Internet de SPSS France est 
http://www.spss.com/fr/index.htm). 


Éditez le fichier USA.XLS original (c’est-à-dire simplement les données brutes, avant 
toute manipulation effectuée sous Excel) sous Excel et supprimez la colonne de dates. Le 
fichier de données se présente donc comme à la figure 2.1, page 46, mais sans les dates ; 
les colonnes À, B, C, D, E sont maintenant occupées par les variables CT, R, UR, Y, P. 


Quittez Excel. Ouvrez SPSS. Cliquez successivement sur Fichier/Ouvrir/Données. Une 
boîte de dialogue s’ouvre ; choisissez Mes Documents dans Rechercher dans, et Excel dans 
Type de fichier, puis cliquez sur usa.xls pour le sélectionner. Cliquez sur Ouvrir. La boîte 
de dialogue Ouvrir la source de données Excel s’ouvre. Cochez Lire le nom de variables, 
puis cliquez sur OK : les données s'affichent en mode tableur. Cliquez sur Données puis 
sur Définir des dates. Une boîte de dialogue Définir des dates s'ouvre (voir figure 2.6, page 
suivante). 

Sélectionnez Années dans Les observations sont, et saisissez 1960 dans Date de départ. 
Cliquez sur OK. La fenêtre Résultats1 — Viewer SPSS s’ouvre et signale que deux nouvelles 
variables ont été créées : YEAR_ et DATE. Ces deux variables sont ici identiques et 
contiennent la liste des années successives. Réduisez la fenêtre : les données s’affichent 


Modèle linéaire en univers stationnaire 


61 


62 


Figure 2.6 


Figure 2.7 


en mode tableur, avec deux colonnes supplémentaires, à savoir year_ et date_ 


ES ans titre - Editeur de données SPSS -181x| 
Fichier Ediion Affichage Donnée 


Transformer Analyse Graphes Outils Fenêtre Aide 


CEE ENEES EE EE] 
fie 1210.75 


Les observations sont : 
- Date de départ : nn) 
Années, timestres Hs Sp ri Restaurer | 
Années, mois 
Années, timestres, mois Année : 1960 Annuler | 
Jours E 
Semaines, jours Aide | 


Semaines, jours ouvrés(5] 
Semaines, jours ouvrés(6] 
Heures 

Jours, heures 

Jours, heure ouvrée{8) Ra a 


= Dates courantes: 
= Aucune 


44] 6210000! 5,604000 I 
2066,74| 66843000] 4676000] 2276860] 41/03800| 
205381] 7,557000| 5.826000 | 2259 700| 45,17000| 


2n97 an 7 SRANON (3 23 48 Fan] | 
4 


16 000 
[&{#{\ Affichage des données Pr des variables 


{SPSS processeur est prêt [ 
Démarrer | (NENE) | Espsspo. == (DJMes do. : ÉlSans GE 17:02 


2132580, 36,60900 


. Cliquez 


sur Transformer puis sur Calculer. La fenêtre Calculer la variable s'affiche comme à la 


figure 2.7. 


ES ans titre - Editeur de données SPSS -181x| 


Fichier Edition Affichage Données Transformer Analyse Graphes Outils Fenêtre Aide 


\ Calculer la variable x] 


Variable destination : Expression numérique : 


2j <j>] 2j ef room: [2] 
El «>| a[sel ABS (expmum] 
El 2 


ANYÎtest valeur. valeur.) F — 


® YEAR, not periodic Fi + a ARTAN(expmum) 


(BY DATE. FORMAT: 


1978,44 


É 310000! 5 “604000 7 D 280! 36 “80200 1972 [1 972 
2066, 74] 6 843000 | 4,876000! 2276 #60] 41 06800 | 1973 11973 Fe 
Le] Affichage des données y Affichage des variables [el ui » 
{SPSS processeur est prêt [ [ [ 
Démarrer || 17:30 


| | spsspoly. doc. F}suvey ed. | {Mes docume..|| fs Sans titre … Fr Résultats -… \RS 


Déplacez-vous pour rechercher LN(exprnum) dans la zone Fonctions. Double-cliquez 
sur LN(exprnum), ou bien sélectionnez LN(exprnum) et cliquez sur la flèche orientée 
vers le haut (voir figure 2.8, page ci-contre). 


Sélectionnez ct, cliquez sur la flèche orientée vers la droite (voir figure 2.9, page ci-contre). 


Saisissez LCT dans la zone Variable destination (voir figure 2.10, page ci-contre). 


Cliquez sur OK : les données s'affichent en mode tableur avec une colonne supplémen- 
taire, en occurrence Ict. Répétez deux fois ces opérations pour créer successivement le 
logarithme de y et le logarithme de p. Les données apparaissent toujours en mode tableur, 
avec les colonnes supplémentaires ly et Ip. Cliquez sur Transformer puis sur Créer la série 
chronologique. La fenêtre Créer la série chronologique s’ouvre. Double-cliquez sur Ict, ou 
bien sélectionnez Ict et cliquez sur la flèche orientée vers la droite. Sélectionnez Différence 
dans le menu déroulant Fonction, puis saisissez DLC dans la zone Nom et cliquez sur 
Remplacer (voir figure 2.11, page 64). 
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[AL DATE. FORMAT: ‘ 


5,604000 


2132580 


38 80900 


4,876000 


2276860 


4103800 


5,625000 


2259,700 
fn 230 


45,17000 
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: Calculer la variable 


rt 
@ur 
dy 
DP 


< YEAR, not periodic 
[AL DATE. FORMAT: ‘ 


LP4D(chaîne longueur] 
LPAD(chaîne longueur, car] 


5,604000 


2132580 


38 80900 


4.876000 


2276860 


4103800 


5,625000 


2259,700 
fn 230 


45,17000 
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: Calculer la variable 


< YEAR, not periodic 
[AL DATE. FORMAT: * 


LP4D(chaîne longueur] 
LPAD (chaîne longueur car] 


5,604000 


2132580 


38 80900 


4.876000 


2276860 


4103800 


5,625000 


8 4R7N00 
données 


2259,700 
fn 230 


45,17000 
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Figure 2.11 
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Figure 2.13 


{ Régression linéaire 


(sl) 


 DIFFLY.1) [dy] | 


DDIFFLPA AP Ÿ] 
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Figure 2.14 


Figure 2.15 


Figure 2.16 


Cha 


Cliquez sur OK : les données s’affichent en mode tableur avec une colonne supplémentaire, 
en l’occurrence dlc. Répétez les opérations pour calculer DLY et DLP. Les données 
s'affichent en mode tableur avec les colonnes supplémentaires dly et dlp. Cliquez sur 
Analyse dans la barre de menus horizontale puis sur Régression et enfin sur Linéaire (voir 
figure 2.12, page ci-contre). 


Cliquez sur dlc puis sur la flèche vers la droite au niveau de la zone Variable dépen- 
dante. Cliquez sur dly puis sur la flèche vers la droite au niveau de la zone Variables 
explicatives. Cliquez sur dlp puis sur la flèche vers la droite, toujours au niveau de la zone 
Variables explicatives (voir figure 2.13, page ci-contre). 


Sélectionnez Entrée dans la fenêtre Méthode. Cliquez sur Statistiques (voir figure 2.14). 


ÉlSans titre - Editeur de données SPSS -1#/1x| 


Liche A Régression linéaire x 


D ct + Variable dépendante : ok 
L Régression linéaire : Statistiques x] 


- Coefficients de régression — 
+ | M Estimations 


M Qualité de l'ajustement 


M Variation de R-deux 


Fe Annuler : 5 

# | Intervalles de confiance 1 Caractéristiques de : £ 
FN Matrice de covariance M Mesure et corrélations partielles Aide 7231334 
D! 7,26| 3,35 


F Tests de colinéarité 


ne — processeur est prêt 


ADémarrer|| | [5 18:38 
| S}spsspob… | M}survey_e. | (_JMes doc... Es Sansti… [ERésulats… qe 


Cliquez sur Poursuivre. Vous obtenez les résultats des figures 2.15 à 2.19, page suivante. 


Variables introduites/éliminées? 


Variables Variables 
Modèle 
introduites éliminées Méthode 


DIFF(LP,1),, introduire 
L DIFF(LY,1)4 
Toutes variables requises introduites 


P-Variable dépendante : DIFF(LCT,1) 


Récapitulatif du modèle 


Changement dans les statistiques 
2 r2 Erreur TEA | 
Modèle R use [Standard de | Variation se Modification | Durbin 
austé | estimation Variation! aa |ad2 | . deF. 
deF signification 


8-Valeurs prédites : (constantes), DIFF(LP,1), DIFF(LY, 1) 
DVariable dépendante : DIFF(LCT,1) 
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Figure 2.17 


Figure 2.18 


Figure 2.19 


ANOVA® 


Carré Hs 
F Signification 


Somme 
des 
carrés 


Régression 2 0,003 | 32,292 0,000 
Résidu 31 0,000 
Total 33 


8-Variable dépendante : DIFF(LCT,1) 
DValeurs prédites : (constantes), DIFF(LP,1), DIFF(LY, 1) 


Coefficients® 


Coefficients non Coefficients Intervalle de confiance 
standardisés standardisés à 95 de B 
Modèle t Signification 


Erreur x Borne Borne 
Bêta a ai 
standard inférieure | supérieure 


1 (constante) | 1,628E-02 
DIFF(LY,1) 0,696 
DIFF(LP,1) -0,137 


8-Variable dépendante : DIFF(LCT,1) 


Coefficients de corrélation? 


Corrélations DIFF(LP,1 1,000 0,461 
DIFF(LY,1 0,461 1,000 


Covariances DIFF(LP,1 6,726E-03 4,248E-03 
DIFF(LY,1 4,243E-03 1,258E-02 


8-Variable dépendante : DIFF(LCT, 1) 


EXERCICE À RÉGRESSION LINÉAIRE AVEC EASYREG 


Énoncé 


Refaites l’exercice 1 en utilisant le logiciel Easyreg. 


Généralités sur Easyreg 


EasyReg est un logiciel économétrique avancé, téléchargeable sur le site http://econ.la. 
psu.edu/-hbierens/EASYREG.HTM. Il a été créé par le professeur Herman Bierens (1). 


Démarrez Easyreg en cliquant sur son icône. Cliquez sur File, puis sur Choose an input 
file. Vous avez le choix entre : 


* lire un fichier de données généré sous Excel et enregistré comme type de fichier CSV ; 


1. HJ. Bierens, EasyReg International, Department of Economics, Pennsylvania State University, University 
Park, PA, 2002. 
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* lire un fichier enregistré dans un autre format ; 


+ continuer une session précédente, avec les données déjà utilisées au cours de cette 
session. 


Pour les deux premières commandes, vous devez indiquer dans quel dossier de l’ordinateur 
démarrer la session (la procédure est expliquée plus loin). 


Avant d’aller plus loin, sachez que lorsque vous démarrez Easyreg dans un dossier (réper- 
toire ou folder) du disque dur, celui-ci crée dans ce dossier un sous-dossier (sous-répertoire 
ou sub-folder) EASYREG.DAT, avec d’une part des fichiers INPUT, INPUTI.RAN and 
INPUT2.RAN, et d’autre part plusieurs fichiers OUTPUT : un fichier texte avec les résultats 
appelé OUTPUT.TXT, et d'éventuels fichiers graphiques *.BMP. Si vous démarrez Easyreg 
à partir d’un répertoire contenant déjà un sous-répertoire EASYREG.DAT issu d’une 
session de travail précédente, le logiciel permet de continuer la session précédente. À 
la première utilisation de Easyreg, le répertoire de départ est C :\; ensuite, il démarre 
par défaut à partir du répertoire contenant les résultats de la session de travail la plus 
récente. Si vous travaillez simultanément sur plusieurs projets, il est utile de créer des 
(sous-)répertoires différents, et de démarrer systématiquement Easyreg dans le répertoire 
souhaité. 


Une première manière d’organiser les données consiste à les placer dans un fichier CSV 
et à les délimiter par des points-virgules dans les versions francophones d’Excel où le 
symbole décimal utilisé est la virgule, ou par des virgules dans les versions où le symbole 
décimal utilisé est le point. 


Si vous disposez de k variables ayant chacune n observations, organisez le fichier de 
données sous Excel de la manière suivante, où x(1, j) est l'observation de date j pour la 
variable j : 


Name(1) Name(2) ... Name(k) 
XCLSTE) XCLEA) Te ga CXCIEKI 
x(2,1) X(2227) une XCASKS 
x(n,1) X(NX2) 4x “XCns.K) 


Ensuite, enregistrez ce fichier au format CSV séparateur point-virgule. Puis ouvrez-le sous 
WordPad pour l'afficher : 


Name(l);Name(2);...;Name(k) 
ROLL 2 CR 
Xl) EC2 2) EX CAR 
X ENT CN., 295.4 sÉXCNKI 


Les données x(5, j) utilisent la virgule pour les décimales (format par défaut). Si vous optez 
pour ce format, le logiciel vous demandera ensuite quel est la balise à insérer pour signaler 
d'éventuelles données manquantes. 


Le deuxième format de données possible est le suivant. Si vous disposez de k variables ayant 
chacune n observations et si vous souhaitez que la balise « m » représente d'éventuelles 
données manquantes, organisez le fichier de données de la manière suivante, où x(5, j) est 
observation de date i pour la variable j : 
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K m 
Name of variable 1 
Name of variable 2 


Name of variable k 


x(1,1) x(1,2) ... x(1,k) 
XC2,1) X(2,2) 4:24 XC2,K) 
x(n,l) x(n,2) x(n,Kk) 


La balise « m » peut correspondre par exemple à —99999. Indiquez 0 si aucune donnée 
n’est manquante. Lorsqu'il s’agit de séries temporelles, les données ne peuvent manquer 
qu'aux observations extrêmes des variables. Pour des données transversales, elles peuvent 
manquer n'importe où. 

Vous pouvez aussi réaliser ces fichiers directement sous WordPad, sans passer par Excel. 


Lecture des données, transformation et estimation 


Dans cet exemple, vous devez transformer le fichier Excel déjà utilisé, USA.XLS, en un 
fichier USA.TXT selon la méthode décrite précédemment. 


Ouvrez le fichier USA.xls avec Excel et supprimez la première colonne de dates. Cliquez 
sur Fichier puis sur Enregistrer sous, et sélectionnez CSV (séparateur point-virgule) pour 
le type de fichier. Laissez Disque local € :\ dans la zone Enregistrer dans et conservez 
USA comme nom du fichier. Cliquez sur Enregistrer. Le logiciel fabrique alors un fichier 
USA.csv dans C :\. 

Ouvrez Easyreg et cliquez successivement sur File/Choose an input file/Choose an Excel 
file in CSV format. Dans la fenêtre Guided tour qui s’ouvre, cliquez sur la réponse de 
votre choix. Si vous demandez de voir le Guided tour, vous devez ensuite réduire la fenêtre 
Guided tour on importing Excel files in CSV format pour pouvoir continuer à travailler 
avec Easyreg (et voir la fenêtre About CSV files). Dans la fenêtre About CSV files, cliquez 
sur Continue. Vous accédez à une fenêtre Find a CSV file. Sélectionnez Manually dans la 
zone Search options, C : dans Choose drive, et C :\ dans Choose drive/directory. Cochez 
Double click to choose file and continue. Double-cliquez sur C :\usa.csv dans Files found. 


La fenêtre Data type ofthe CSV file s’affiche. Cochez sur Annual time series. Inscrivez 1960 
dans Year of first observation et cliquez sur OK. Cliquez sur Confirm, puis sur Continue. 
La fenêtre Analyzing the CSV file s'affiche. Cliquez sur Code OK. La fenêtre Data written 
to files s'affiche. Cliquez sur Continue. La fenêtre Check the data s’ouvre. Cliquez sur 
Continue. 

La fenêtre About the start-up folder EASYREG.DAT s’affiche. Cliquez sur Continue. La 
fenêtre Choose drive and folder to start-up EasyReg s'affiche. Double-cliquez sur € :\. 
Ensuite indiquez USA dans Make a new sub-folder in the Current folder, Enter the folder 
name et cliquez sur OK. Cliquez sur Start Easyreg in current folder puis sur OK. 

Le logiciel revient au menu de départ. Cliquez successivement sur Menu/Input/Transform 
Variables pour calculer les différences logarithmiques des variables CT, Y et P, puisque le 
modèle à estimer est spécifié en fonction de ces transformations. Le logiciel affiche alors 
une liste de transformations possibles. Choisissez d’abord Logarithmic Transformations. 
Le logiciel affiche la liste des variables. Cliquer deux fois sur les variables à transformer : 
CT, Y et P. Une étoile se place devant chacune d’elles. Cliquez sur Selection OK. Le logiciel 
affiche la liste des nouvelles variables. Cliquez alors sur OK. 
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Vous revenez au menu des transformations. Cliquez alors sur Time series transformations. —_ 
Une liste de transformations s'affiche. Cliquez sur Difference. Le logiciel propose un retard 
de une période pour la différence, donc m = 1. Cliquez une nouvelle fois sur Différence. 
Vous obtenez Select variables to be transformed avec la liste des variables existantes. 
Double-cliquez sur IN(CT), IN(YT) et LN(P) et cliquez sur Selection OK. Vous obtenez 
la liste des nouvelles variables en différence. Cliquez sur OK. Vous revenez au menu des 
transformations. Cliquez alors sur Done. Vous revenez au menu principal. 


Pour estimer le modèle, cliquez successivement sur Menu/Single equation models/Linear 
regression models. Cliquez sur Not now. Le message Select all variables in your linear 
regression model s'affiche. Il faut donc sélectionner les noms des variables dépendante 
et explicatives, que celles-ci apparaissent dans le modèle avec un retard ou sans. Double- 
cliquez sur DIFI(LN(CT)), DIFI(LN(Y)) et DIFI(LN(P)). Cliquez sur Selection OK. 
Le logiciel vous demande si vous voulez utiliser un sous-ensemble d’observations. Cli- 
quez sur No, puis sur Continue. Le message Select the Y variable in your OLS model 
s'affiche, avec la liste des variables. Sélectionnez la variable dépendante : double-cliquez 
sur DIFI(LN(CT)). Une étoile s'inscrit devant cette variable. Cliquez sur Continue. 


Le logiciel affiche le nom de la variable choisie. Cliquez encore sur Continue. le message 
Select the independent X variables s'inscrit. Confirmez la sélection des variables explica- 
tives. Le programme propose toutes les variables restantes, en l'occurrence DIFI(LN(Y)) 
et DIFI(LN(P)), en les faisant précéder d’une étoile. Si vous êtes d’accord avec cette 
sélection, cliquez sur Selection OK. Le logiciel vous demande d’indiquer si, parmi les 
variables explicatives, il faut ajouter un ou plusieurs retards de la variable dépendante. Ici, 
pour le modèle à estimer, ce n’est pas le cas. Ne sélectionnez donc rien et cliquez sur Skip 
all. Le logiciel vous demande s’il faut mettre dans le modèle la valeur contemporaine ou/et 
un ou plusieurs retards de la première variable explicative DIFI(LN(Y)). Ici, choisissez 
uniquement la valeur contemporaine : double-cliquez sur DIFI(LN(Y)) et cliquez sur 
Selection OK. 


Le logiciel demande s’il faut mettre dans le modèle la valeur contemporaine ou/et un 
ou plusieurs retards de la deuxième variable explicative DIFI(LN(P)). De nouveau, 
choisissez uniquement la valeur contemporaine dans ce cas de figure : double-cliquez 
sur DIFI(LN(P)) puis cliquez sur Selection OK. 


Le message Select deterministic X variables s'affiche. Cliquez sur No intercept si vous 
ne voulez pas de constante, et sur Time Trend pour ajouter un trend dans les variables 
explicatives. Ce n’est pas le cas ici. Cliquez donc sur Continue. Le logiciel demande sil 
faut ajouter un polynôme de Tchebishev au modèle. Répondez par la négative dans cet 
exemple. Laissez donc g = 0 en cliquant sur q OK. Cliquez sur Continue à deux reprises. 
Le logiciel affiche les résultats : 

Model variables : 

y = DIFICLNECTI]] 

x(1) = DIFICLNIY]] 

x(2) = DIFICLNIP]] 

x(3) = 


Available observations : t = 2(=1961) -> 35(=1994) 
= Chosen 


OLS estimation results for Ÿ = DIFI[LNICTI] 
Variables OLS estimate t-value H.C. t-value(*) 
s.e. H.C. s.e.(*) 
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x(1 


x (2 


x(3) = 


H.C. p 


[p-value] [H.C. p-value](*) 
DIFIL[LNIY]] .696018 6.206 6.395 
.1216E-0 1.0884E-0 
[0.000001] [0.000001] 
DIFIL[LNIP]] -.136784 -1.668 -1.910 
.2010E-02 7.1610E-02 
[0.10541] [0.05612] 
1 .016282 2.534 2:537 
.4249E-03 6.418/7E-03 
[0.01654] [0.01119] 
(*) Based on White’s heteroskedasticity consistent variance matrix. 
The p-values are two-sided. The standard p-value = P(|[t(31)|>]t-valuel), 
where t(31) is € distributed with 31 degrees of freedom. 
The H.C. p-values are based on the normal approximation: 
-value = P([u|>[H.C. t-value|), where u is N(0,1) distributed. 
rd error of the residuals: 97.549362E-004 


Standa 
Resid 
Total 
Overal 
p-val 
Signi 
Critic 
Concl 
R-squa 
Adjust 
Effect 


Test for first-order autocorrelation: 


Durbin 


REMARK : 


al sum of squares (RSS): 
sum of squares (TSS): 


1 F test: F(2,31): 

e = 0.00000 

ficance levels: 10% 
al values: 2.48 
sions: reject 
re: 


ed R-square: 
ive sample size (n): 


-Watson test: 


29.499221E-004 
90.956092E-004 


32.29 
5% 
3:38 
reject 
0.675676 
0.654752 
34 
1.953474 


À better way of testing for serial correlation 


is to specify ARMA errors and then test the null 
hypothesis that the ARMA parameters are zero. 


Jarque 


Nul] 


Breusc 


Nul] 
Null d 
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hypothesis : 


-Bera/Salmon-Kiefer test: 


p-value = 0.69300 
Significance levels: 
Critical values: 
Conclusions: 


h-Pagan test: 


istribution : 
p-value = 0.91407 
Significance levels: 
Critical values: 
Conclusions: 


ivers stationnaire 


./33446 


hypothesis: The errors are normally distributed 
Null distribution: Chi-square(2)) 


10% 5% 

4.61 54.99 

accept accept 
.1/79704 


The errors are homoskedastic 
Chi-square(2) 


10% 5% 
4.61 5:::99 
accept accept 


If the model 
expectation of the model error u re 
lagged dependent (y) variables and 
en the OLS parameter estimators b(1),...,b(3), minus their true values, 
y distributed with zero mean vector 


th 


are (asy 


an 


1.25790 
4.24264 


provided 


( 


( 


is ho 
1.18457 
5.07015 


E-002 4.24264 
E-003 6.7/72559 


-5.87975E-004 -4.39615 


that the condi 


E-002  5.07015 
E-003 5.12796 


-6.19792E-004 -4.01183 
if the conditional variance of the model error u is not constant 


u is he 


teroskedastic). 


oskedastic), or 


ptotically) jointly normal 
d variance matrix: 


E-0 
E-0 
E-0 


Cha 


is correctly specified, in the sense that the conditional 
ative to the X variables and all 
agged X variables equals zero, 


04 
04 
05 


al variance of the model error u is constant 


E-003 -5.87/7975 
E-003 -4.39615 
E-004 4.12796 
tion 

E-003 -6.19792 
E-003 -4.01183 
E-004 4.11998 


E-0 
E-0 


E-0 


04 
04 
05 


Le logiciel affiche donc les coefficients estimés (OLS estimate), suivis de leur statistique 
(f value), de leur écart type estimé (s.e.), de la probabilité critique du test de l'hypothèse 
que le coefficient vrai correspondant est nul (p value). À la colonne suivante le logiciel 
affiche les écarts types calculés selon la méthode de White (voir chapitre 3) robuste à 
une hétéroscédasticité éventuelle des erreurs (H.C. s.e.) ainsi que les statistiques { (H.C. 
t value) et les probabilités critiques correspondantes (H.C. p value). Ces valeurs modifiées 
sont quasiment identiques aux valeurs calculées normalement, ce qui démontre l’absence 
de problème d’hétéroscédasticité des erreurs. L'avantage d’Easyreg est qu’il rappelle pour 
chaque test l'hypothèse précise qui est testée (null hypothesis) et qu’il donne explicitement 
la conclusion de l'interprétation. 
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Ce chapitre aborde plusieurs points relatifs à 
l’inférence statistique basée sur un modèle linéaire. 

Il traite des tests d'hypothèses sur les coefficients du 
modèle, de l'estimation du modèle linéaire par 
maximum de vraisemblance, de la multicolinéarité, de 
l’utilisation de variables indicatrices, des estimateurs 
de variance robustes, de l’estimateur des moindres 
carrés généralisés, des modèles linéaires sur des 
données en coupe instantanée et de la méthode des 


variables instrumentales. 


Compléments sur les modèles linéaires 


7 


75 


76 


El Tests d’hypothèses linéaires 


1.1 


sur plusieurs coefficients 


TEST GÉNÉRAL DE RESTRICTIONS LINÉAIRES SUR LES COEFFICIENTS 


On suppose que Ÿ et X sont liés par un modèle linéaire Y = XB + u, où u est indépendant 
de X et est un bruit blanc normal : u + N(0,X,) où Z, = 0?1,. On souhaite tester un 
ensemble de restrictions linéaires portant chacune sur un ou plusieurs coefficients du 
vecteur $. 


Exemple 


On veut tester la véracité simultanée des deux restrictions suivantes : B; = 1 et B; = B4 dans le 
modèle : 
Ye = Bi + BK + B3X 3 + BaXar + ue 


Pour cela, trois étapes : 


1. On estime le modèle par MCO sans aucune restriction, et l’on garde la somme des carrés 
des résidus ainsi obtenue, notée SE. 


2. On estime le modèle par MCO en imposant les restrictions, et l’on garde la somme des carrés 
des résidus ainsi obtenue, notée SE2. 


3. On montre que, si les restrictions sont vraies, alors : 


(n— &) (SE2 — SE) 

PT F(m,n—k) (3.1) 
et il suffit de calculer la valeur de ce test et de la comparer aux valeurs critiques d'une table 
de la distribution de Ficher à m degrés de liberté au numérateur et n — k degrés de liberté 
au dénominateur. Il s'agit d'un test de petit échantillon, donc d'un test exact quelle que 
soit la taille de l'échantillon, si le terme d'erreur est normal. C'est en fait une transformation 
monotone du test du rapport de vraisemblance des mêmes restrictions, mais ici la distribution 
est exacte puisqu'on a fait l'hypothèse que le terme d'erreur est normal. 


Exemple (suite) 


Pour tester les deux restrictions de l'exemple précédent, on estime donc le modèle sans restric- 
tions : 
GMCO |. ÊMCO MCO 
VB +3 Xu +... +8 Xu+e 


n . . + . . 
et l'on garde la valeur SE = e'e = >, e?. Puis on estime le modèle avec restrictions : 


Ye — Xa = BE + 83 CO (Xe + Xar) + À 
et l'on garde la valeur SE2 = 66 — ue &. Puis on calcule : 


(n — k) (SE2 — SE) 
mSE 


et l'on compare la valeur obtenue aux valeurs critiques d'une table F(2, n — 4), ou bien on utilise 
un logiciel pour obtenir la probabilité critique. 
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1.2 TEST D'UNE OÙ DE PLUSIEURS RESTRICTIONS LINÉAIRES EE 
SUR LES COEFFICIENTS 


On suppose que Ÿ et X sont liés par un modèle linéaire Y = XB + u, où u est indépendant 
de X, est un bruit blanc : Z, = 021, et a une distribution normale. Un ensemble de m 
restrictions linéaires sur les coefficients B peut être représenté de manière générale par : 


RB=r (3.2) 


où R, B et r sont des matrices de type m x k pour R, k x 1 pour B, et m x 1 pourr. 


Exemple (suite) 


Les restrictions B2 — 1 et B3 — B4 peuvent être représentées par : 


Sous lhypothèse H, que ces restrictions sont vraies, c’est-à-dire que RB = r, on montre 


aisément que : 
1 
se ee 
n—k 


Il s’agit d’un test de Wald modifié par une division par m, qui nécessite uniquement une 
estimation du modèle sans restrictions. On montre que la valeur obtenue est identique à 
celle du test calculé selon la formule de la section précédente pour les mêmes restrictions, 
et qui nécessite les estimations du modèle sans restrictions et avec restrictions. 


ep (R x) R) (RB—r) = F(mn-—} (3.32) 
m 


Dès lors que le terme d’erreur est un bruit blanc et normal, il s’agit d’un test de petit 
échantillon, donc d’un test exact quelle que soit la taille de l'échantillon. 


Si u n'a pas une distribution normale, le test est quand même asymptotique. Puisque 
l 


ù X'X 
Vn (6 — 6) + N(0, 02Q7 1) et plim—— = Q, on montre aisément que : 
n 


1 L 
ee ? Kn 
n—k 


Il s’agit d’un vrai test de Wald. Bien que la distribution asymptotique de W soit x?, la 


(3.3b) 


/ FRA ET SE = 
W = (RB-r) (R (XX) R) RB-r) 


distribution F appliquée à — fournit en pratique une meilleure approximation pour # 


petit. Pour tester l'hypothèse RB = r, il suffit donc de calculer le membre de gauche de 
l'expression précédente, de diviser le résultat par m, et de comparer le tout aux valeurs 
critiques d’une table de la distribution Fischer à m degrés de liberté au numérateur et n —k 
au dénominateur. Pour réaliser ce test, on n’a besoin uniquement d’estimer le modèle non 
contraint par MCO, et ensuite de calculer la valeur du test par la formule précédente. 
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1.3 TEST D'UNE SEULE RESTRICTION LINÉAIRE SUR LES COEFFICIENTS 


On souhaite tester une seule hypothèse H, de restriction linéaire sur les coefficients, qui 
peut se formaliser par : 


wB = x (3.4) 


où w est un vecteur k x 1 et x un scalaire 1 x 1. 


Exemple 
Bi 
La restriction B3 — B4 peut être représentée par (0 0 —11) . — (0). Dans ce cas, r = 0 et 
3 
Ba 
0 
0 
W = 
—1 
1 
On montre que sous H,, donc si w/B = x est vraie, alors : 
wBMCO x 
 Énk (3.5) 


/ 


e! e Hi 
w (XX)! w 
n—k 


Pour tester l’hypothèse w/B = x, il suffit d'estimer le modèle sans restrictions, Y = XB+u, 
par MCO. On obtient le modèle estimé Y — XBMC0 + e, On calcule alors la valeur de la 
formule du test et on la compare aux valeurs critiques d’une distribution f,_4. Il s’agit là 
d’un cas particulier du test précédent : celui où m = 1. On sait en effet qu’une variable 
aléatoire ayant une distribution F(1, n — K) a une racine carrée qui a une distribution f,_+. 


1.4 TESTS DE VALEURS PARTICULIÈRES POUR TOUS LES COEFFICIENTS 


On souhaite tester l'hypothèse que le vecteur B est égal à un vecteur de valeurs 
particulières B. On sait que, pour les valeurs « vraies inconnues » f de la réalité, 


A ! A 

(pe — 6) X'X (EE + 6) (n = k) 
(e"e)k 

À SN À _ 
(pie + 6) X'X (S 7 6) (n . k) 
L (ee) k 
l'hypothèse que B = B, il suffit donc d’estimer le modèle linéaire Y — XB + w sans 
restrictions. On obtient un modèle estimé Y = XBMC0 + e, on calcule la formule du 
test et on la compare aux valeurs critiques d’une distribution F(k, n — k). Dès lors que 
le terme d’erreur est un bruit blanc et normal, il s’agit d’un test de petit échantillon, 
donc d’un test exact quelle que soit la taille de échantillon, c’est-à-dire même avec peu 


d'observations. C’est un cas particulier du test de Wald modifié, ou test F, de plusieurs 
restrictions linéaires sur les coefficients lorsque le terme d’erreur est un bruit blanc. 


— F(k,n — k) (voir chapitre 2). Cela implique 


 F(k,n — k). Pour vérifier 


que si B = f, alors 
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F1 Estimation du modèle linéaire 
par maximum de vraisemblance 


L'objet de cette section est d’expliquer comment on peut estimer un modèle linéaire du 
type Y = XB + u par la technique du maximum de vraisemblance (1), sous l'hypothèse 
que u est indépendant de X et que u + N(0,2,), où 2, = 021, (u bruit blanc). Les 
hypothèses faites sur le terme d’erreur impliquent les égalités suivantes : 


RO) = fau. Got) = fatale) fo) = [[EG) (66 
t=1 


2 
u£ 


e 2ù pour tout f (3.7) 


1 

fu (ur) ê Var 
On observe la réalisation du vecteur Y et celle de la matrice X. La fonction de vraisemblance 
de échantillon est donc fr, x,,..x, (Y, X2,... X,). Si l’on raisonne conditionnellement à X, 
la fonction de vraisemblance de l'échantillon est fy1x,, x, (Y1X2, ... X,), notée simplement 
fix (YIX). Puisque Y est une fonction de u, la distribution de Y conditionnellement à X 
doit être calculée à partir de la distribution de u conditionnellement à X, qui est égale à 
la distribution marginale de u, puisque u et X sont indépendants : f, (u|X) = f, (u). Il 
suffit donc d'appliquer la formule habituelle permettant d’obtenir la fonction de densité 
d’une variable aléatoire, qui est fonction d’une autre variable aléatoire dont on connaît la 
densité. Puisque le Jacobien vaut 1, on obtient : 


n 1 (-h-2E px)” 
_ (nr ex) 
fra. Xa ŒIX25 +2 Xn) = ] [ e 2% = L(B,o?) (3.8) 


y 0, V2T déf 


Par conséquent, le logarithme de la fonction de vraisemblance est fourni par : 


k 2 
n ( she de px) 
> 


2 
26? 


In L(B,0%) = = In2x = no 


=1 
= je n27x 7 In Ce DAT Ge 1) (3.9) 
2 2 202 


Les estimateurs de maximum de vraisemblance de f et o? sont les solutions du système 
d'équations formé par les deux conditions de premier ordre : 


_ dInL (8,0) 


6 
alnL 0 
0 = AE) (3.10) 
Ces solutions sont : 
BAT boss 
2 — æ (3.11) 
n 


1. Pour quelques rappels utiles sur l’estimation par la méthode du maximum de vraisemblance, le lecteur peut 
se référer par exemple au chapitre 5 du livre de Patrick Roger, Probabilités, statistique et processus stochastiques, 
publié chez Pearson Education France dans la même collection. 
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Les conditions de deuxième ordre pour un maximum sont respectées. L’estimateur de 
maximum de vraisemblance de f, noté BM, est ainsi égal à l’estimateur des moindres 
carrés ordinaires de ÿ, noté BMCO, Par contre, l’estimateur de maximum de vraisemblance 


, a9MV : a , : , ER : 
de 0°, noté 6? , n'est pas égal à l’estimateur des moindres carrés ordinaires de o?, noté 


x 2MCO MvV  n—k ,mco 


67 ,CarO, — o, . Bien sûr, cette différence est d’autant plus petite que nest 


grand, et elle devient insignifiante quand n est très grand. 


La matrice d’information est : 


In L (6, o? o,-(XX) 0 
3 B 3 B 204 
0 0? 


Par conséquent, la borne de Rao Cramer est : 


1 


(XX) 0 
1 2 # 
R'(B,0%) = 264 (3.13) 
0 
n 


L'estimateur de MCO de B, égal à l’estimateur de maximum de vraisemblance de B, a une 

matrice de variance et de covariance égale à la borne de Rao Cramer. Il est donc forcément 

le plus précis de tous les estimateurs sans biais. Il est en outre efficient. On remarque 
x 9MV ei À 9MV À 3MCO + À 3MCO 

que 67 est biaisé : E (62 ) Æ 02 alors que 6%  o2 est sans biais : E (62 ) re 


.  a9MCO ÿ nr : x 9MCO 
Toutefois 67 ‘a une variance supérieure à la borne de Rao Cramer : V (62 ) = 


u 
20 20% : . 
Arr Cependant, pour un grand échantillon, on se rapproche de la borne : 
n — n 


4 
. XMCO 26 , x>MCO . . 
lim V (6 ) = —, Par conséquent, 67 est asymptotiquement efficient. 


n— 00 n 


Test du rapport de vraisemblance. La fonction de vraisemblance fournit un test asymp- 
totique pratique et général pour tester simultanément plusieurs contraintes portant 
chacune sur un ou plusieurs coefficients du modèle linéaire. Le principe est d’estimer 
d’abord le modèle linéaire sans restrictions sur ses coefficients. La valeur de la fonction 
de vraisemblance maximisée de ce modèle est notée L,. Ensuite, on estime le modèle 
linéaire en imposant à ses coefficients toutes les restrictions que l’on souhaite tester. La 
valeur de la fonction de vraisemblance maximisée de ce modèle contraint est notée Lo. 
On montre que, si les restrictions sont vraies, la valeur absolue de 2{In(L:) — In(Lo)) suit 
asymptotiquement une loi Chi-2 à p degrés de liberté, où p est le nombre de restrictions 
testées sur les coefficients. On rejette les restrictions quand la valeur de ce test est supérieure 
aux valeurs critiques à un seuil de 5 % ou de 1 % d’une loi de Chi-2 à p degrés de liberté. 
En d’autres termes, c’est lorsque les restrictions provoquent une forte chute de la fonction 
de vraisemblance : L; est très supérieure à L,, ce qui rend la différence de leurs logarithmes 
trop grande. Le test du rapport de vraisemblance est asymptotique, c’est-à-dire qu’il suit 
une distribution de Chi-2 quand le nombre d’observations tend vers l'infini. Pour des 
échantillons réduits, sa distribution n’est qu'approximative ; des tests de petit échantillon 
peuvent être plus fiables. 
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FE] Multicolinéarité 


On parle de multicolinéarité lorsqu'il y a des corrélations assez élevées entre certaines 
variables explicatives, ce qui affecte la matrice (X/X)-!. On peut calculer l’estimateur des 
moindres carrés ordinaires, mais il est d’autant plus imprécis que la multicolinéarité est 
forte. Plus celle-ci augmente, plus les variances des coefficients estimés croissent aussi. Si 
des variables explicatives sont très liées linéairement, il est difficile de mesurer l'impact 
respectif de chacune d’elles sur la variable à expliquer. Souvent, en cas de corrélation 
forte entre deux variables explicatives, on ne peut rejeter l'hypothèse de nullité de leurs 
coefficients pris individuellement, alors que l’on rejette l'hypothèse de nullité conjointe. 
L'observation de ce phénomène indique la présence de multicolinéarité. 


La multicolinéarité est dite parfaite quand une colonne de la matrice X est une combinaison 
linéaire d’une ou de plusieurs autres colonnes de X, en d’autres termes quand une variable 
explicative est une combinaison linéaire exacte d’autres variables explicatives. Dans ce cas, 
le rang de X est inférieur à k, ce qui implique que le rang de X’X est également inférieur 
à k. La matrice X’X n’est donc pas inversible ; il est impossible de calculer l’estimateur des 
moindres carrés ordinaires. 


F1 Variables indicatrices 


Une variable est dite indicatrice (ou dummy) quand elle est artificielle ; on lui attribue 
des valeurs particulières aux différentes observations, pour faire varier la valeur de la 
constante de manière déterminée, en fonction des observations. En économétrie des 
séries temporelles, on emploie le plus souvent des variables indicatrices d’impulsion, de 
saut et de saison. 


A.1 VARIABLE INDICATRICE D'IMPULSION 


Une variable indicatrice d’impulsion est telle que toutes ses observations valent 0, sauf 
une observation, qui vaut 1. Si f; est la date de l’impulsion, alors : 


DU, =0 sit£t, (3.14) 
DU; — 1 si A — t; 


Lorsqu'on introduit une telle variable parmi les k variables explicatives d’un modèle 
linéaire, celui-ci devient : 


Yi = Bi +BaXar +BaX 3 + BaXar + + Br 1 Xp 1 +BKkDU: + pour t=1...n (3.15) 
et : 

Yi = Bi + B2X2 + Ba X 3e + BaXar + + Br iXu 1 +w pour ft <t; et t>t; (3.16) 
et 

Ye = (Bi + Ba) + BaX2r + B3X 3 + BaXas + +: + BriXu1 + pour f=t; (3.17) 


La constante du modèle vaut B: en toute période, sauf à la période f; où elle vaut 1 + Bz. 
On utilise une variable indicatrice d’impulsion lorsque la variable dépendante présente 
un saut à partir d’une date bien particulière, qui ne peut pas être expliqué par un saut 
comparable, à partir de cette date, d’une variable explicative. 
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a A.2 VARIABLE INDICATRICE DE SAUT 


Une variable indicatrice de saut est telle que toutes ses observations valent 0 avant une 
certaine date, et toutes ses observations valent 1 à partir de cette date : 


DU; =0 si t<t; (3.18) 


Lorsqu'on introduit une telle variable parmi les k variables explicatives d’un modèle 
linéaire, celui-ci devient : 


Yi = Bi +B2X2 + Ba X 3 + BaX ar +: Br Xe 1 Be DU; +w pour t=1...n (3.19) 
ou encore : 

Yi = Bi + BaX + BaX 3 + BaXa + - + + Br1Xg 1 + pour ft <f; (3.20) 
et 
Yi = (Bi + Br) + BaX2 + B3X 3e + BaXar + + Br iXw1y +w pour {> (3.21) 


La constante du modèle vaut B; en toute période avant la date f;, et B1 + By à la date f; 
et ultérieurement. On utilise une variable indicatrice d’impulsion lorsque la variable 
dépendante présente un saut à partir d’une date bien particulière, qui ne peut pas être 
expliqué par un saut comparable, à partir de cette date, d’une variable explicative. 


A.3 VARIABLE INDICATRICE SAISONNIÈRE 


En données mensuelles, on introduit des variables indicatrices saisonnières pour obtenir 
une constante ayant les propriétés suivantes : 


+ Elle est différente pour chacun des douze mois d’une même année. 
+ Elle est identique pour un même mois, quelle que soit année. 


On définit des variables indicatrices DU1, DU2...DU11 de la manière suivante, quelle 
que soit l’année : 


DUI;=1  sitest un mois de janvier. 

DUI;=0  sif n’est pas un mois de janvier ou de décembre. 
DUI;=—1 sitest un mois de décembre. 

DU2; = 1 si t est un mois de février. 

DU2; =0  sif n’est pas un mois de février ou de décembre. 


DU2; = —-1 sitest un mois de décembre. 
DUIl;=1 sitest un mois de novembre. 


DUI11;=0 sif n’est pas un mois de novembre ou de décembre. 


DU11; = —1 sit est un mois de décembre. 
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Lorsqu'on introduit de telles variables parmi les K variables explicatives d’un modèle 


linéaire, celui-ci devient : 


Ye = Bi + BaXas + B3X 3e + BaXas + + + Ben Xe 11y + Be-10 DUT: + Br 9DU1, +... 
+BkDUII; +u pour t=1...n (3.22) 
et: 
Ye = (Bi + Bx-10) + B2X 2 + BaX 3 + BaXas + + + Br Xe + 
si t est un mois de janvier, 
Ye = (Bi + Br) + BaX2 + BaX3r + BaXur + 22 + Brie n + 


si { est un mois février, 


Ye = (Bi — (Be-10 + Bo + - - + + Bx)) + B2X2r + B3X 3e + BaXar + 
+ Bruins + #4 sit est un mois de décembre. 


On utilise des variables indicatrices saisonnières lorsque la variable dépendante présente 
un cycle saisonnier qui ne peut être expliqué par l’évolution des variables explicatives, ces 
dernières n’ayant pas de cycle comparable. On évite ainsi que cette composante cyclique 
inexpliquée se retrouve dans les résidus calculés du modèle estimé, qui sera autocorrélé. 
La variation de la valeur de la constante, selon les mois de l’année, prend en compte le 
cycle saisonnier de la variable dépendante, palliant le fait que l’évolution des variables 
explicatives ne peut l’expliquer. 


Remarque 


Pour les données trimestrielles, le principe est le même, mais on définit seulement trois 
variables indicatrices. 


El Estimateurs de variance robustes 
5.1 ESTIMATEURS DE VARIANCE ROBUSTES À L'HÉTÉROSCÉDASTICITÉ 


Si le terme d'erreur u est hétéroscédastique, la vraie matrice Zsmco x de variance et 


de covariance des estimateurs de MCO n’est pas égale à o2 (X’ 1 et ne peut donc être 
# Æ S € Li ; ue : ne 
estimée par Zimcoix = un (X'X)" ?, qui est la formule utilisée par défaut par les logiciels 
n — 


d’économétrie. Le plus fréquemment, la forme de l’hétéroscédasticité est inconnue, tout 
comme la formule précise de Zsmco x. Il est donc impossible d'établir un estimateur sur 
mesure de cette matrice. White [WHI 1980] a toutefois défini un estimateur convergent 
de Zjuco x quelle que soit la forme de l’hétéroscédasticité. MacKinnon et White [MAC 
1985] en ont proposé une version corrigée pour les degrés de liberté, mieux adaptée pour 
les petits échantillons (1) 


n 
he ir de pl bts D és) bad 
1=1 


1. La formule originale de White [WHI 1980] est ÊMe = (X'x) ! CD xx) XX) !. 


fMCoIx 
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où x, est un vecteur dont les éléments sont les observations de la ligne t de la matrice X. 
Les racines carrées des éléments de la diagonale principale de X sont donc des estimateurs 
convergents des écarts types (standard errors) des estimateurs de MCO en cas d’hété- 
roscédasticité des erreurs, contrairement aux écarts types estimés calculés par défaut par 
les logiciels d’économétrie. Bien entendu, la convergence est une propriété de grands 
échantillons : quand ils sont petits, le résultat peut être médiocre. 


5.2 ESTIMATEURS DE VARIANCE ROBUSTES À L'HÉTÉROSCÉDASTICITÉ 
ET À L'AUTOCORRÉLATION 


Si le terme d’erreur u est autocorrélé, la vraie matrice DE MCOyx de variance et de covariance 


3 » : R 1 À ER: 
des estimateurs de MCO n'est pas égale à 0? (XX) et ne peut donc être estimée 
x e_e _1 | : Lr, 
par Ejucox = sn (XX), qui est la formule utilisée par défaut par les logiciels 
n = 
d’économétrie. 
Le plus fréquemment, la forme de l’autocorrélation est inconnue, tout comme la formule 
précise de Zsmco,x. Il est donc impossible d'établir un estimateur sur mesure de cette 
matrice, d'autant plus que l’autocorrélation s'accompagne souvent d’hétéroscédasticité, 
dont la forme est également inconnue. Newey et West [NEW 1987] ont toutefois proposé 
un estimateur convergent de Zsmco,x quelles que soient les formes de l’autocorrélation 
et de l’hétéroscédasticité. On peut lui appliquer la correction de petit échantillon de 


MacKinnon et White [MAC 1985]. On obtient la formule (1) 


DU . . L AX) | Ro + >_wG,m) (&, + @) (XX) (3.23) 


j=1 


A n 
où (2; = D _ erer-jxX ; pour tout j = 0...m et où les coefficients w(j, m) déter- 
=j 


minent une fenêtre de retards (tronquée à m retards). On distingue plusieurs formes de 
fenêtre : 


- la fenêtre uniforme : 


w(j;,m) =1 pourtout j=1...mMm 
+ la fenêtre de Bartlett : 
W(j, M) = 1 — = pour tout j=1...m 


- la fenêtre de Parzen : 


: 2 . 3 
1 
w(jm) = 1 s ] ) -6( | ) He 


m +1 m +1 2 
et 
] à m +1 
jm) =2( -i) im>j> 


1. La formule initiale de Newey et West est DAV = (61.0 (8 + > W(ÿ M) (&; + e)) ( Re 
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La valeur de m doit être choisie arbitrairement. Un terme d’erreur autocorrélé en moyenne 


mobile d’un ordre connu impose l’usage d’une fenêtre uniforme. C’est le cas en finance, 
lorsqu'on veut tester l'hypothèse d’efficience d’un marché et que l'horizon des anticipa- 
tions dépasse la longueur de l’intervalle temporel entre les données successives. Dans les 
autres cas, la fenêtre de Parzen est généralement préférable aux autres formes. Les fenêtres 
de Bartlett et de Parzen garantissent l’obtention d’une matrice de variance et de covariance 
estimée qui soit semi-définie positive, même si m est grand par rapport à n. 

Les racines carrées des éléments de la diagonale principale de la matrice de Newey et 
West sont donc des estimateurs convergents des écarts types des estimateurs de MCO en 
cas d’autocorrélation ou d’hétéroscédasticité des erreurs, contrairement aux écarts types 
estimés calculés par défaut par les logiciels d’économétrie. Bien entendu, la convergence 
est une propriété de grands échantillons : quand ils sont petits, le résultat peut être 
médiocre. 


La matrice de White décrite précédemment correspond en fait à celle de Newey et West 
quand m = 0. 


EH Estimateur des moindres carrés généralisés 


En cas d’autocorrélation ou d’hétéroscédasticité du terme d’erreur u d’un modèle linéaire 
Y = XB+u,un'est pasunbruitblanc:E, Æ o°1, mais ZE, = o°Q où & est définie positive. 
Il en résulte que, même si le terme d’erreur est indépendant des variables explicatives, la 


matrice de variance et de covariance de l’estimateur des moindres carrés ordinaires n’est 
ee 


plus égale à o? (XX) et ne peut donc être estimée par - ER). Les écarts types 


des coefficients de MCO publiés par défaut par les logiciels sont donc faux, puisqu'ils sont 
ge 


calculés d’après la formule ps Ex valable uniquement si u est un bruit blanc. 


Des estimateurs linéaires sans biais, plus précis que l’estimateur de MCO sont disponibles, 
et celui-ci n’est plus un estimateur linéaire sans biais de variance minimale. 

Cela dit, si u est indépendant des variables explicatives, les estimateurs de MCO restent 
sans biais et convergents. Leur précision est en fait fortement altérée par lautocorrélation 
et l’hétéroscédasticité. Ces dernières augmentent la probabilité que, sur un échantillon 
particulier, une valeur estimée soit éloignée de la valeur vraie du coefficient. 

Si Y = XB + u, que Z, = o°Q, que E(u) — 0, et si u est indépendant des X; et @ connu 
(o? étant un paramètre inconnu, tout comme le vecteur B), la méthode des moindres 
carrés généralisés (MCG) permet de mieux estimer f que celle des MCO. 


L'estimateur de MCG est défini par : 


ÉNE ECO Lx) "Xe ty (3.24) 


e"e 


n—k 


montre aussi que sous les hypothèses décrites précédemment : 


est un estimateur sans biais de 0°. On 


Si l’on pose e = Y — XBMCG, l'expression 


Djuco = 0 (X'Q IX) (3.25) 


L'application pratique directe des estimateurs des moindres carrés généralisés est assez 
limitée car elle exige la connaissance préalable de la matrice de variance et de covariance 
ZX, du vecteur u des termes d’erreur successifs. 
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Prévision 


Après avoir estimé un modèle linéaire, on peut l’utiliser pour produire des prévisions de 
la variable dépendante sur des périodes postérieures à celles de l’échantillon ayant servi à 
l'estimation. Ces prévisions sont évidemment conditionnelles à des valeurs supposées des 
variables explicatives durant les périodes concernées. De manière générale, si le modèle 
linéaire a été estimé, la prévision ponctuelle de la valeur de la variable dépendante à la 
période n + l'est donnée par : 


Pages PONS ue Le po RE RME (3.26) 


où Xyu = (IXont... Xpnti). On a obtenu les coefficients estimés en utilisant les 
matrices Ÿ et X qui rassemblent les données des périodes 1 à n. Sous l'hypothèse que 
le terme d’erreur u est un bruit blanc et normal, un intervalle de confiance de la valeur de 
Y,+1 est fourni par : 


x ; e’e 
PIPEUE 7 (- : :) (+ X4 AA Xi) 


4 


À / ee 
< Your SO Xe u (- = 


—1 
) (+X 0 eu) | = 1 a 
Où fa/2 est la valeur critique d’une loi de Student à n — k degrés de liberté au seuil de 
signification à/2 et où e est le vecteur des résidus issus de l’estimation du modèle linéaire 
sur les périodes 1 à #1. 


E Modèles linéaires en coupe instantanée 


GÉNÉRALITÉS 


Le concept de modèle linéaire peut s'appliquer à des variables dépendante et explicatives 
qui mont pas la dimension du temps, mais pour lesquelles les différentes observations 
correspondent à des agents distincts durant une même période de temps. Un modèle 
linéaire suppose alors l’existence de coefficients non aléatoires B1,82...fx identiques 
quel que soit l’agent concerné, tels que : 


Yi = B1 + BaXai + B3X3; + +: + BrXx + uw pourtout i=1...n (327) 


où nest l'effectif des agents différents. 


Dans une régression en coupe instantanée, le concept d’autocorrélation, désignant une 
dépendance du terme d’erreur vis-à-vis de son passé, n’a plus aucun sens tel quel. Les tests 
d’autocorrélation comme celui de Durbin et Watson ne sont donc pas appliqués en coupe 
instantanée. Mais cela n’écarte pas le risque que les erreurs de certains agents soient liées 
entre elles. Le concept d’autocorrélation est simplement remplacé par l’absence d’indé- 
pendance entre les erreurs d’agents différents. En série temporelle, l’oubli de variables 
explicatives importantes, comme une variable dépendante retardée, peut impliquer une 
dépendance entre les erreurs d’une période particulière t et des périodes précédentes, 
comme f — 1. En coupe instantanée, si l'étude porte sur des agents pouvant être répartis 
en différentes classes, l’erreur d’un agent particulier d’une classe quelconque risque d’être 
liée aux erreurs des agents de cette même classe. 
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8.2 VARIABLES INDICATRICES ET MÉTHODES ANOVA EE 


Comme en série temporelle, on peut utiliser dans des régressions en coupe instantanée 
des variables indicatrices qui valent, pour chaque agent, 1 ou 0 selon que l’agent concerné 
appartient ou pas à une certaine catégorie. Le coefficient d’une telle variable exprime 
alors dans quelle mesure l'appartenance de l’agent à cette catégorie influe sur la valeur 
de la variable dépendante. Cette analyse est très répandue en sciences de gestion, où 
elle est connue sous le nom d’ANOVA (ANalysis Of VAriance, en français « analyse de 
variance »). On distingue plusieurs types d’ANOVA : celle à un facteur (la plus simple) ou 
encore celle à deux facteurs avec répétition d’expérience. L'objectif général d’une ANOVA 
est de déterminer si la valeur d’une variable métrique prise (par une personne, une 
institution, pays, région, entreprise...) dépend des modalités prises par une ou plusieurs 
caractéristiques qualitatives de cet individu (plus précisément, par une caractéristique 
dans le cas de l'ANOVA à un facteur, et par deux dans le cas de l'ANOVA à deux facteurs 
avec répétition d'expérience). Une ANOVA à un facteur revient statistiquement à tester 
si l'espérance de la variable métrique est égale pour des individus ayant une même 
modalité de la caractéristique qualitative et pour d’autres individus partageant aussi 
une même modalité, mais différente de la précédente. Pour l'ANOVA à deux facteurs 
avec répétition d'expérience, on doit disposer, pour chaque modalité de la première 
caractéristique qualitative, de groupes d'observations différents de la variable pour chaque 
modalité différente de la deuxième caractéristique. Vérifier l'hypothèse nulle revient ici 
à tester si l'espérance de la variable pour un individu pris au hasard est la même quelles 
que soient : 


+ la modalité qu’il a pour la caractéristique 1 ; 
+ la modalité qu’il a pour la caractéristique 2 ; 


+ la combinaison de modalités qu’il a pour les caractéristiques 1 et 2 (interaction). 


EH Méthode des variables instrumentales 


9.1 PRINCIPE DE LA MÉTHODE 


La méthode des variables instrumentales, ou auxiliaires, s’applique lorsque le terme 
d'erreur d’une équation linéaire n’est pas indépendant de certaine(s) variable(s) expli- 
cative(s). Dans ce cas en effet, l’estimateur des moindres carrés ordinaires est biaisé et 
n’est pas convergent (le biais ne tend donc pas à disparaître si la taille de l’échantillon 
est grande). Il produirait donc une erreur systématique des valeurs estimées. Le cas 
le plus fréquent où le terme d’erreur n’est pas indépendant de certaine(s) variable(s) 
explicative(s) est Le cas où il y a simultanéité, et donc un impact de la variable dépendante 
sur une variable explicative. 


Soit un modèle linéaire habituel : 
Ye = Bi + B2X2 +... Pre + uw où Y = XB+u (3.28) 


où u, est bruit blanc et où certaine(s) variable(s) explicative(s), parmi les X;, ne sont pas 
indépendantes du terme d’erreur u,. On ne peut donc pas estimer les B; en calculant par 
la méthode des moindres carrés ordinaires une régression linéaire des données de Y sur 
les données des X;. 


Méthode des variables instrumentales 87 


88 


L'idée est alors de « purger » les variables explicatives X; de leur partie liée linéairement à w, 
c’est-à-dire de remplacer les X; par des variables transformées X; proches des X; initiales, 
mais non liées à u. Bien entendu, on ne touche pas aux variables explicatives X;, parmi les 
X;, qui ne semblent pas liées à u. Pour ces quelques variables X;, À; = X;. 


Comment fabriquer les transformations X;? Pour chaque variable explicative X;, on 
prend simplement la partie expliquée d’une régression linéaire de X; sur un ensemble de 
p variables instrumentales (ou auxiliaires) que l’on suppose de façon arbitraire non liées 
linéairement à u. Forcément, la partie expliquée de X; par ces variables instrumentales 
n’est pas liée à u puisqu'il s’agit d’une fonction linéaire de variables non liées à #. On 
sélectionne donc a priori p variables instrumentales W,, pour r = 1...p. W; est une 
simple colonne de 1 et donc égale à X1. Les variables W, peuvent contenir certaines 
variables X; originales : celles supposées indépendantes de u. Il faut que p soit plus grand 
ou égal à k. Les p colonnes de la matrice W, qui contient n lignes, sont les différentes 
variables instrumentales W,, pour r = 1...p. 


Pour chaque variable X;, on calcule par MCO le modèle estimé suivant : 
Xi = VE VW + YO Wa + Gr (3.29) 
Cela permet de définir la partie expliquée de X; par les variables instrumentales : 
Ra = DAC + GHOOWR, + + pHOOU, (3.30) 
Bien entendu, dans les cas particuliers où X; figure parmi les variables instrumentales, les 
coefficients estimés sont tous nuls, sauf celui de la variable elle-même, qui est égal à 1; 


on obtient par ailleurs un résidu toujours nul, ce qui implique que À; = X;. On estime 
alors par MCO une régression de Y sur les X; : 


Y, = @MC0 + GMOOZ,, +... GMOOL, + e, (3.31) 


Les coefficients estimés obtenus sont les estimateurs de variables instrumentales des 
coefficients « vrais inconnus » Ê; : 


Bi\ far 
pur | | ane 
B=l . [=| . (3.32) 
Q VI GS MCO 
k Pk 


Si l’on regroupe dans une matrice X les k variables X;, X a n lignes et k colonnes. Si l’on 
regroupe dans une matrice W les p variables W;, W a n lignes et p colonnes. L'ensemble 
des régressions de chaque variable X; sur les variables instrumentales peut donc être 
représenté de manière matricielle : 


X=Wÿ"O LE (3.33) 


où Ve 
1,MCO 
Yi 


est une matrice à p lignes et k colonnes, chaque colonne étant l’un des vecteurs 
qui regroupe les p coefficients ÿMC de la régression de X; sur les variables instru- 
mentales W,, pour r = 1...p. E est une matrice à n lignes et à k colonnes correspondant 
aux k vecteurs de résidus e;. On utilise la définition des estimateurs de MCO : 


91 = (WW) IW'X (3.34) 


Compléments sur les modèles linéaires 


Chäpitre 
On regroupe les k variables À; dans une matrice X à n lignes et k colonnes : 


X = Wÿ"C0 = WWW) IW'x (3.35) 


L'estimateur de variables instrumentales de B est alors l’estimateur de MCO de la régression 
de Y sur les variables X; de X. Par conséquent, 8"! = (X'X)-1X'Y, ce qui implique : 


B"T — (XWOW'W)-IW'X) X'W(WW)-IW'Y (3.36) 
Il s’agit de la formule générale de l’estimateur de variables instrumentales. Dans le cas 
8 8 
particulier où p = k, W’X est une matrice carrée inversible et l’estimateur s'écrit ainsi : 


BV = (WX) IW'Y (3.37) 


Dans tous les cas, dès lors que les variables instrumentales sont indépendantes de #, on 
montre que ces estimateurs sont convergents : 


plimB" =$ 


Les résidus d’une estimation par variables instrumentales sont définis par eV! = y — XV! 
et un estimateur convergent de o2 est fourni par la formule ele"! /(n — k) si u est bruit 
blanc. Un estimateur convergent de la matrice de variance et de covariance de BV! est alors 
donné par ((e"eV1)/(n — H))}(X'W(W'W)-!W'X) 


Remarque 


Il ne faut pas confondre les résidus d'une estimation par variables instrumentales avec les 
résidus d’une estimation par moindres carrés ordinaires en deux étapes, ou doubles moindres 


carrés, définis par e2MC — y — XVI, 


9.2 QUALITÉ DE L'AJUSTEMENT ET TESTS 


Les statistiques R? et R? ajusté, quoique fournies par la plupart des logiciels dans les 
tableaux de résultats obtenus par variables instrumentales, ne sont en fait pas valables et 
peuvent conduire à des conclusions erronées [PES 1994]. Dans le contexte des variables 
instrumentales, on doit leur préférer les statistiques R? et R? ajustée généralisées. Celles-ci 
sont calculées d’après les mêmes formules que les statistiques R? et R? ajustée ordinaires, 
mais on remplace la série de résidus e par la série eV! + (X — X)BVT. 


Pour vérifier l’hypothèse d’absence d’autocorrélation des erreurs, on ne peut se servir 
du test de Durbin et Watson car il n’est pas valable sur des résidus estimés par variables 
instrumentales. On peut par contre utiliser le test LM d’autocorrélation des résidus estimés 
par variables instrumentales de Sargan, qui est distribué comme une x ? à p degrés deliberté 
sous l'hypothèse nulle d'absence d’autocorrélation du terme d’erreur contre l’hypothèse 
d’autocorrélation d’ordre p. Ce test est décrit par Breusch et Godfrey [BRE 1981]. Pesaran 
et Taylor [PES 1997] présentent en détail Les tests applicables dans le contexte des variables 
instrumentales. 
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Résumé 


Dès lors que le terme d’erreur est un bruit blanc et normal, on dispose de la 
distribution exacte de plusieurs tests qui permettent de vérifier des hypothèses 
portant simultanément sur plusieurs coefficients d’un modèle linéaire. Sous 
l'hypothèse de normalité, un modèle linéaire peut aussi être estimé par la 
méthode du maximum de vraisemblance, qui fournit les mêmes estimateurs 
des coefficients que ceux obtenus avec les moindres carrés ordinaires. La 
multicolinéarité réduit la précision des estimateurs de MCO. L'utilisation de 
variables indicatrices en séries temporelles permet de modéliser la saisonnalité 
et des événements particuliers non pris en compte par les autres variables expli- 
catives. Alors que les écarts types obtenus de manière classique ne sont corrects 
que si les erreurs sont un bruit blanc, on dispose d’estimateurs des écarts types 
des coefficients estimés qui sont robustes même en cas d’hétéroscédasticité 
ou d’autocorrélation. C’est aussi dans ces situations que les estimateurs de 
MCG sont plus précis que les estimateurs de MCO. On peut utiliser un modèle 
estimé par MCO pour générer des prévisions ponctuelles ou des intervalles de 
confiance pour la variable dépendante. La méthode des MCO peut s’appliquer 
à des modèles linéaires reliant des données en coupe instantanée; dans ce 
contexte, l’utilisation de certaines variables indicatrices produit des analyses 
ANOVA. Lorsque le terme d’erreur est lié à certaines variables explicatives, 
il faut recourir à la méthode des variables instrumentales pour obtenir des 
estimateurs convergents. 
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EXERCICE | 


VENTES D'UNE ENTREPRISE DE GRANDE DISTRIBUTION 


Énoncé 


Figure 3.1 


Vous disposez de données historiques sur les ventes de l’une des principales chaînes 
de grande distribution des États-Unis et sur le revenu disponible des ménages amé- 
ricains, dans le fichier de type tableur DISTRIB.xIs téléchargeable sur le site Internet 
www.pearsoneducation.fr. Les définitions des variables de ce fichier sont les suivantes : 


VENTES : les ventes totales de tous les magasins de l’entreprise ; 
REVDISMN : le revenu disponible des ménages aux États-Unis. 
Sur la base de ces données, répondez aux questions suivantes : 


+ Les achats des ménages dans les magasins de cette entreprise augmentent-ils plus vite, 
aussi vite ou moins vite que le revenu disponible des ménages? 


+ Comment chiffrer à l'avance la croissance des ventes de l’entreprise résultant d’une 
croissance donnée du revenu disponible des ménages? 


Résolvez ce problème avec un logiciel tableur et TSP. 


Solution avec Excel 


Les données se présentent de la manière suivante, dans le fichier DISTRIB.XLS (voir 
figure 3.1). 


Œ) Eten Eten éffchge Mein Form, Qui Qorrdes Froftm L Acrobue -l#Ix) 
DéSgSæm r-@rzct WE las -LU-6171$ FF WXxmAMEœEæL-d-A-. 
ae 

L:] + CL] 
A B C D E F = 

1 DATE VENTES REVDISMN 

2 1981 2,445 2128 

3 1982 3,376 2261 

4 1983 4,667 2428 

5 1984 6,401 2669 

6 1985 8,401 2839 

7 1986 11,909 3013 
[8] 1987 15,959 3195 

9 1988 20.65 3479 

10 1989 25,811 3726 

11 

12 

13 

14 

15 

16 . 
W 41» bi\ Feu {Feu { Feutà / Il pe | 
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Les questions de l’exercice portent sur la relation entre les ventes de l’entreprise et le revenu 
disponible des ménages américains. Pour mesurer cette relation, il est utile de visualiser 
les données au moyen d’un graphique. 


Une relation existe clairement entre les deux variables : les ventes augmentent quand le 
revenu disponible augmente. Elle ne semble pas tout à fait linéaire, mais plutôt légèrement 
exponentielle. Il est donc intéressant de visualiser aussi le graphique des logarithmes de 
ces variables. Pour cela, créez des variables LV et LR égales aux logarithmes népériens des 
variables initiales (voir figure 3.2). 


Vous obtenez le graphique de LV en fonction de LR (voir figure 3.3). 


Figure 3.2 El Microsoft Excel - distrib ER 
IP] uicher Gdtion affihoge inserton Format Quels Données Fenêtre 2 acrcbet =is1xi 
Dé 8m n-@s:r-A ME "lan -w- 621$ ER xant2:3 ŒRÆ _-n-A-. 
ar 

ny zl = 
A B C D E E:) 
1 DATE VENTES  REVDISMN LV LR 
2 1981 2,445 2128 =LN(B2) =LN(C2) 
3 1982 3,376 2261 =LN(B3) =LN(C3) 
4 1983 4,667 2428 =LN(Bd4) =LN(C4) 
5 1984 6,401 2669 =LN(B5) =LN(C5) 
G 1985 8,401 2839 =LN(BG) =LN(C6) 
7 1986 11,909 3013 =LN(B7) =LN(C7) 
8 1987 15,959 3195 =LN(B8) =LN(CB8) 
9 1988 20,65 3479 =LN(B9) =LN(C9) 
10 |1989 25,811 3726 =LN(B10) =LN(C10) 
11 
12 
1 
14 
15 
16 s 
je. « » :biN Graphi /'Græhé ) reuil1 {Feb {Feu / la! EU | 


Prêt NUM 
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Figure 3.3 Log des ventes en fonction du log du revenu disponible 
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Log du revenu 
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Figure 3.4 


Ch 


La linéarité est plus nette dans la relation entre les logarithmes des séries que dans la 

relation entre les séries brutes. Par ailleurs, la problématique de départ porte sur une 

élasticité : 

+ Les ventes de l’entreprise augmentent plus (respectivement moins) vite que le revenu si 
l’élasticité des ventes au revenu est supérieure (respectivement inférieure) à 1. 

+ La réponse de la croissance des ventes à celle du revenu dépend de l’élasticité des ventes 
au revenu. 


Or, l’élasticité des ventes au revenu est la dérivée partielle du logarithme des ventes au 
logarithme du revenu. Conclusion : c’est la relation entre les logarithmes des ventes et du 
revenu qui est intéressante. Il faut donc estimer les coefficients du modèle suivant : 


In(VENTES,) = B: + B2 In(REVDISMN;) + u 


où u, est le terme d’erreur, c’est-à-dire la partie de l’évolution du logarithme des ventes 
qui ne s'explique pas linéairement par l’évolution du logarithme du revenu. 

Pour réaliser cette estimation par moindres carrés ordinaires avec Excel, procédez ainsi : 
Cliquez sur Outils et vérifiez que l’option Utilitaire d’analyse est dans le menu déroulant. 
Si elle ne s’y trouve pas, cliquez sur l'option Macros complémentaires et, dans le menu 
déroulant, sélectionnez Utilitaire d’analyse puis cliquez sur OK. Cette fois, au prochain 
clic sur Outils, vous accéderez à l’Utilitaire d’analyse. 

Cliquez donc sur Outils puis sur Utilitaire d'analyse. Dans le menu déroulant, sélectionnez 
Régression linéaire et cliquez sur OK. Dans Plage pour la variable Y, placez les cellules des 
données de la variable dépendante : $D$1:$D$10. Dans Plage pour la variable X, placez 
les cellules des données de la variable explicative : $E$1:$E$10. Cochez l'option Intitulé 
présent pour indiquer que ces plages contiennent les noms des variables (voir figure 3.4). 


Régression linéaire 


Paramètres d'entrée 
Plage pour la variable Y; $D$1:$D$10 


Plage pour les variables X: $E$1:$E#10 


MN intitulé présent D Intersection à l'origine 


D Niveau de confiance [es % 


Options de sortie 


© Plage de sortie: [ si 
(Insérer une nouvelle feuille: [rélitats 


© Créer un nouveau classeur 


Analyse des résidus 
D Résidus [ Courbes des résidus 
D Résidus normalisés D Courbes de régression 


Probabilité normale 
[ Diagramme de répartition des probabilités 


Cliquez sur OK. Vous obtenez les résultats (voir figure 3.5, page suivante). 


La valeur estimée de B;, calculée par la formule de l’estimateur BMD, est donc 4,25711. Il 
s’agit d’une estimation de lélasticité B des ventes de l’entreprise au revenu disponible des 
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Figure 3.5 FA Microsoft Excel - distrib 
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2 
3 Statistiques de la régression 


4 |Coefficient de 0099753472 
5 [Coefficient de 0,99507552 
6 Coefficient de 0,939437202 
7 |Erreurtype : 0,06150006 


8 [Observations 9 

9 

10 ANALYSE DE VARIANCE 

11 Degré de libertmme des carienne des car F Valeur critique de F 

12 |Régression 1, 5,34988437) 5349886437) 1414 46845 2,44359E-09 
13 |Résidus 7, 00264758 0,00378226 

14 [Total 8, 5,37636017 

15 

16 Coefficients | Erreur-type | Statistique t Probabilité | Limite inférieure pour seuil de confiance = 95% | Limite supérieure pour 
17 Constante :-31,6815938 0,89922904 -35,2319514 3,8514E-09 -33,80793112 
18 !LR 4,25710517. 0,11319252) 37 6094197 _2,4436E-09 3,989447574 
19 

20 


ménages, sur la période 1981 à 1989. Par conséquent, de 1981 à 1989, une augmentation 
de 1% du revenu disponible des ménages induit en moyenne une augmentation de 
4,25711 % des ventes de l’entreprise (voir figure 3.1, page 91). 


Le graphique de la figure 3.6, compare les vraies valeurs des ventes en logarithme et les 
valeurs calculées par la régression ; l'ajustement est excellent. Les erreurs sont très faibles. 


Figure 3.6 3,5 
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© Log (ventes) —@— calculs 


Réponses aux questions de l'exercice 


Durant la période étudiée, les achats des ménages auprès de cette entreprise de grande 
distribution ont augmenté plus vite que leur revenu disponible puisque Pélasticité estimée 
des ventes au revenu est supérieure à 1. 


En supposant que cette élasticité reste stable dans le temps, vous pouvez l'utiliser pour 
prévoir la croissance des ventes de l’entreprise conditionnellement à une prévision donnée 
de croissance du revenu disponible des ménages. Par exemple, si vous prévoyez une 
croissance de 1,5% du revenu disponible des ménages, vous pouvez en inférer une 
prévision de croissance de 4,25711 X 1,5 = 6,385665 % des ventes de l’entreprise. 
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Quelle est la fiabilité de ces conclusions? 

D’après les résultats précédents, l’élasticité des ventes au revenu est estimée à 4,25711 
durant la période 1980-1989. Cette valeur estimée est-elle fiable? Pour répondre à cette 
question, il faut tenir compte des points suivants : 


+ Les valeurs calculées de BC et B/1C0 ne sont pas les vraies valeurs de B1 et B, qui 


restent inconnues. En effet, BC et MC sont des estimateurs. 


+ La précision de ces estimations est inversement proportionnelle aux écarts types des 
estimateurs. Il faut donc examiner les écarts types estimés des coefficients pour connaître 
leur précision. 

Les logiciels donnent des estimations de ces écarts types, calculées selon une méthode qui 
n’est correcte que si le terme d’erreur est un bruit blanc. 


Avant de se fier aux écarts types affichés, il faut donc tester deux hypothèses : 
+ L'absence d’autocorrélation : le terme d’erreur n’est pas lié à son passé. 
+ L'absence d’hétéroscédasticité : le terme d’erreur a une dispersion constante. 


Pour apprécier la fiabilité des conclusions qui ont été tirées, il faut examiner les résultats 
de ces tests. 


Solution avec TSP 


Ouvrez le fichier DISTRIB.XLS initial, contenant les données de la variable VENTES et de 
la variable REVDISMN, tel qu’il était avant les manipulations réalisées avec le tableur. Il 
n’est pas nécessaire d’insérer une colonne avec les dates ; mais si vous le faites, nommez-la 
DATE. Pour que le fichier DISTRIB.XLS puisse être lu par TSP il faut l'enregistrer comme 
un fichier de type feuille de calcul Excel (quelle que soit la version), et non comme un 
classeur. Enregistrez ce fichier dans le répertoire C:\ de l'ordinateur, par exemple. Fermez- 
le à présent pour pouvoir le lire avec TSP. Pour les raisons évoquées dans le chapitre 2, il 
faut estimer les coefficients du modèle suivant : 


In(VENTES,) = B: + B2 In(REVDISMN;) + u 


Pour travailler avec TSP, suivez la procédure expliquée au chapitre 2. Ici le programme 
d'instructions est le suivant : 

FREQ A; 

SMPL 1981 1989; 

READ(FILE=’C:\DISTRIB.XLS’); 

LV=LOG(VENTES) ; 

LR=LOG(REVDISMN) ; 

REGOPT(PVPRINT,STARS) ALL; 

OPLOT; 

OLSQ LV C LR; 


L'instruction FREQ A; indique que la fréquence des données est annuelle. L'instruc- 
tion SMPL 1981 1989; définit la période sur laquelle portent les données. L’instruc- 
tion READ(FILE=’C:\DISTRIB.XLS’); lit les données dans le fichier DISTRIBT.XLS 
qui se trouve dans C:\ LV=LOG(VENTES); et LR=LOG(REVDISMN): fabriquent de 
nouvelles variables LV et LR égales au logarithme népérien des variables lues. 
REGOPT(PVPRINT, STARS)ALL ; demande tous les tests disponibles (ALL), avec mention 
des probabilités critiques (PVPRINT) et présence d’étoiles (STARS) si l'hypothèse testée 
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est rejetée. NOPLOT; indique qu'aucun graphique sur les résultats de la régression n’est 
souhaité. OLSQ LV C LR: calcule la régression linéaire de LV sur une constante et sur LR 
par MCO. 


Les résultats sont les suivants : 


Equation 1 


Method of estimation = Ordinary Least Squares 
Dependent variable : LV 
Current sample : 1981 to 1989 
Number of observations : 9 
Mean of dependent variable = 2.12910 
Std. dev. of dependent var. = .819784 
Sum of squared residuals = .026475 
Variance of residuals = .3/78217E-02 
Std. error of regression = .061499 
R-squared = .995076 
Adjusted R-squared = .994372 
Durbin-Watson statistic = 1.47226 
Wald nonlin. ARI vs. lags = .122628 [.726] 
ARCH test = .536009 [.464] 
CuSum test = .361090 [1.00] 


CuSumSq test = .195113 [.733] 
Chow test = .343988 [.724] 
LR het. test (w/ Chow) = -1.14689 [1.00] 


White het. test = 1.67129 [.434] 
Jarque-Bera normality test = .6193/70 [.734] 
F-statistic (zero slopes) = 1414.50 ** [.0001] 
Akaike Information Crit. = -2.54645 
Schwarz Bayes. Info. Crit. = -5.34050 
Log of likelihood function = 13.4590 
Estimated Standard 
C 
1 
1 


Variable Coefficient Error t-statistic P-value 
C -31.6816 .899219 -35.2323 *x [,000] 
LR 4.257 .113191 37.6098 *x [,000] 


L'interprétation des coefficients estimés est étudiée au chapitre 2. Des tests supplémentaires 
permettent d'apprécier la fiabilité des résultats. L'hypothèse d'absence d’autocorrélation 
du terme d’erreur (1) n’est pas rejetée puisque le test de Durbin et Watson vaut 1,47, pas 
plus que l'hypothèse d'absence d’hétéroscédasticité du terme d’erreur au seuil de 5 % car 
les probabilités critiques (entre [ ]) des tests White het, LR het, et ARCH test sont toutes 
supérieures à 0,05. La validité de ces tests asymptotiques est évidemment très incertaine 
sur un échantillon aussi petit, mais on admet ici que les erreurs sont homoscédastiques, 
essentiellement pour des raisons pédagogiques. Vous pouvez donc utiliser les écarts types 
estimés pour apprécier la précision de l'estimation de B, et f2. L'écart type d’un estimateur 
est une mesure de l’imprécision de l’estimateur. La précision de l’estimation de B2 est très 


1. Pour n = 15 et k — 2, les valeurs critiques sont dL = 1,08 et dU = 1,36 au seuil de 5 %. La valeur du test est 
supérieure à dU et inférieure à 4 — dU, ce qui permet de ne pas rejeter l'hypothèse d'absence d’autocorrélation. 
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grande puisque le coefficient estimé vaut 37 fois son écart type. Un intervalle de confiance 
pour 2 est donc très étroit autour de 4,25711. Les conclusions tirées sont fiables. 


La précision d’un estimateur est d'autant plus faible que son écart type est élevé par rapport 
à la valeur du coefficient. Inversément, la précision d’un estimateur est d’autant plus élevée 
que son écart type est faible par rapport à la valeur du coefficient. La colonne f-statistic 
donne, pour le coefficient de chaque variable explicative, le rapport entre sa valeur estimée 
et l’écart type estimé de l’estimateur. La précision avec laquelle un coefficient est estimé 
est donc d’autant plus grande que sa f-stat est élevée. Ici les coefficients sont estimés avec 
une très grande précision : les valeurs estimées de B et de B2 valent, pour la première, 35 
fois son écart type et, pour la seconde, 37 fois. 


EXERCICE 2 VENTES DE BOISSON AU COLA 


Énoncé 


Il s’agit d'établir, début 1981, une prévision des ventes d’une marque de boisson au cola 
pour les années 1981 à 1990. Les données de l’entreprise dont vous disposez sont les séries 
suivantes, de 1970 à 1980 : 


SALES : les ventes de l’entreprise à prix courants (nominales) ; 
PRICE : le prix de vente de boisson au cola de l’entreprise. 


Sont également disponibles des données externes qui peuvent être utiles à l’analyse, pour 
expliquer les ventes de l’entreprise : 


JE le revenu disponible réel des ménages (c’est-à-dire le revenu disponible nominal 
divisé par l’indice des prix à la consommation) ; 


CT la consommation des ménages à prix constants ; 
POP: la population; 

GNP: le produit national brut à prix courants; 

CPI: Pindice des prix à la consommation toutes catégories ; 


CPI-FB : l'indice des prix à la consommation pour la catégorie « food and beverages » 
(aliments et boissons). 


Ces données se trouvent dans la feuille 1 du fichier limonade.xls téléchargeable sur le site 
Internet www.pearsoneducation.fr. 


Résolvez ce problème d’une part en utilisant un tableur, d’autre part en utilisant TSP. 


Méthodologie 


Procédez comme suit : 


1. Spécifiez un modèle explicatif des ventes de la boisson au cola en fonction de certaines 
variables explicatives. 


2. Estimez les coefficients « vrais inconnus » de ce modèle sur les données disponibles de 
1970 à 1980. 


3. Posez des hypothèses sur les valeurs des variables explicatives de 1981 à 1990. Condi- 
tionnellement à ces valeurs, utilisez le modèle pour calculer les valeurs des ventes de la 
boisson au cola pour les années 1981 à 1990. 


Compléments sur les modèles linéaires 


97 


98 


Figure 3.7 


Spécification du modèle 


Supposez que les ventes de cette marque de boisson au cola se déterminent de la manière 
suivante : les quantités vendues par habitant sont fonction du revenu réel des ménages 
par habitant et du prix relatif de cette boisson par rapport au prix moyen de l’ensemble 
des biens et des services de consommation. Cette fonction est vraisemblablement linéaire 
d’un point de vue logarithmique : 


SALES, y, PRICE, 
pese = 1 as 
" (me) JR (Gr) id ( CPI, ) ue 


Que se passe-t-il si vous n’utilisez pas le logarithme de ces variables? Dans ce cas, vous 
supposez que : 


SALES y PRICE 
; = Bi + B—"— +63 TE 


POP,;PRICE; POP, CPI. 


Le modèle implique alors qu'à prix relatif inchangé, une augmentation de 1 dollar du 
revenu entraîne une augmentation de f2 dollars de la consommation de la boisson, quel que 
soit le montant de départ du revenu. En d’autres termes, si un riche et un pauvre reçoivent 
un surplus de revenu de 1 000 dollars, ils vont tous deux augmenter leur consommation 
de ladite boisson d’un même montant. Cela n’a évidemment aucun sens! 


Le modèle en logarithmes peut encore être présenté de la manière suivante : 
LRS; = B1 + B2LYP; + BsLRPR; + u; 


SALES Y, PRICE 
où LRS, = In | =" |,Ly, =In |}, LRPR, =In( ——" |. 
POP,PRICE, POP, CPI, 


Estimation du modèle avec un tableur 


Le fichier de données se présente comme à la figure 3.7. 


icrosoft 


Hi] Fichier Edition Affichage Insertion Format Outils Données Fenêtre 2 Acrobat 


DA & &E AE ?|aria -0-l67Ss ==2=HR@%m'#s#2E# 
a 
D15 “| = 
A B C D E F G H | 2 
1 Sales Population GNP CPI-FB Price CPI Y CT 
2 1970 1606,4 205 32,3 114,7 9,69 35,647 1975,04  1.813,470 
e) 1971 1728,8 208 35,4 118,3 9,96 37,376 2050,70 1.873,720 
4 1972 1876,2 210 38,6 123,2 10,03 38,809 213258 1.978,440 
5 1973 2145 212 42,1 139,4 10,31 41,038 2276,86  2.066,740 
6 1974 2522,2 214 45,8 158,7 12,88 45,170 2259,70  2.053,810 
t 1975 2872,8 216 50,6 122,1 15 48,863 2303,23  2.097,500 
8 1976 3032,8 218 55,6 177,4 14,64 51,787 2387,57 2.207,250 
9 1977 3559,9 220 60,5 188 14,79 55,366 245596  2.296,570 
10 1978 4337,7 223 67,8 206,3 15,93 59,419 2574,33  2.391,810 
fi 1979 4961,4 225 75,6 228,5 17,02 64,685 2639,30  2.448,350 
12 1980 5912,6 228 85,3 248 19,3 71,436  2663,03  2.447,070 
13 
14 
15 
16 
17 
18 
19 
20 
21 
4741» [bi\ Feuil1 { Feul2 { Feuis 7 le IF 
Prêt NUM 


7 s 5 F ke 
‘démarrer. alors ik Feuille de style livre 3... 
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Commencez par créer dans les colonnes J, K et L les variables RS, — Sr. 
POP,PRICE; 
Yi é ; = (). Les formules se présentent comme à la figure 3.8. 
POP, | 
Œ) tuer Eéten Effkhoge Ier Forms Quis Données Feodte 2 Accbm 8x 
Da em n-@rz-A MT lus -0-161$/FF52HYWxmA2œtkæ L-S-A-. 
ae 
u7 + = UN) 
sel J K D: 
1 RS YP RPR 
2 =(B2/F2)/C2 =H2/C2 =F2/G2 
3 =(B3/F3)/C3 =H3/C3 =F3/63 
4 =(B4/F4)/C4 =H4/C4 =F4/G4 
5 =(B5/F5)/C5 =H5/C5 =F5/G5 
6 =(B6/F6)/C6 =H6/C6 =F6/G6 
_7 |=(87/F7)/C7 =H7/C7 =F7/G7 
8 =(B8/F8)/C8 =H8/C8 =F8/G8 
9 =(B9/F9)/C9 =H9/C9 =F9/G9 
10 =(B10/F10)/C10 =H10/C10 =F10/G10 
11 =(B11/F11)/C11 =H11/C11 =F11/611 
12 =(B12/F12)/C12 =H12/C12 =F12/G12 
13 


Puis calculez les valeurs de LRS, LYP et LRPR dans les colonnes M, N et O (voir figure 3.9). 


É) enter Lüton Affhoge iertin Forma Qui Cornées Fegéte 2 Acrobat -l8ix) 
DH em n-@s:zLA MT "a -0-1617$5 FF WxmA AE L-d-A-. 
on FE LUE) - » 

N O P £ 

1 |LRS LYP LRPRFB 

2 =LN(J2) =LN(K2) =LN(L2) 

3 =LN(J3) =LN(K3) =LN(L3) 

4 =LN(J4) =LN(K4) =LN(L4) 

5 =LN(J5) =LN(K5) =LN(L5 
| 6 |=LN(J6) =LN(K6) ENS 

7 =LN(J7) =LN(K7) =LN(L7) 

8 =LN(J8) =LN(K8) =LN(L8) 

9 =LN(J9) =LN(K9) =LN(L9) 

10 =LN(J10) =LN(K10) =LN(L10) 

11 =LN(J11) =LN(K11) =LN(L11) 

12 =LN(J12) =LN(K12) =LN(L12) 

13 


Pour estimer les coefficients du modèle par MCO, sélectionnez successivement 
Outils/Utilitaire d’analyse/Régression linéaire et cliquez sur OK. Remplissez certaines 
cases de l’écran de régression à la figure 3.10, page suivante. 

Cliquez sur OK. Les résultats sont identiques à ceux de la figure 3.11, page suivante. 

Le logiciel a attribué à la feuille de résultats le nom arbitraire que vous avez choisi de lui 
donner : OLS. Vous obtenez des valeurs estimées pour les coefficients « vrais inconnus » 
Bi, B2 et B3 : BMCO = _6,84817, BMCO = 2,492627, BMCO = _0,71303. 


L'élasticité des quantités vendues par habitant au revenu disponible réel par habitant est 
mesurée par fi et sa valeur estimée vaut 2,492627 : par conséquent, si le revenu augmente 
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Figure 3.10 


Régression linéaire 


Paramètres d'entrée t 
Plage pour la variable Y; [érg1 :$M$12 =] 


Plage pour les variables X: $N#1:$0$12 


MN intitulé présent D intersection à l'origine 
D Niveau de confiance 


Options de sortie - 


[es % 
© Plage de sortie: [ si 


fe Insérer une nouvelle feuille: OLS| 


© Créer un nouveau classeur 
Analyse des résidus 


D Résidus D Courbes des résidus 
D Résidus normalisés D Courbes de régression 


Probabilité normale 
[ Diagramme de répartition des probabilités 


Figure 3. 1 L Microsoft Excel - limonade 
Æ Fichier Edition Affichage Insertion Format Outils Données Fenêtre 2 Acrobat 
DH SRB e.-ez AE ? ai -0-67Ss===5 8% 
a 
N29 Ÿ: = 
A B C D E FE 


RAPPORT DÉTAILLÉ 


1 
| 
3 Btatistiques de la régression 
| 4 |Coeffcient de 0,96411899 
| 5 |Coefficient de 0,92952543 
6 
ré 
8 


Coefficient de 0,91190678 
Erreur-type | 0052970686 


Observations 11 

3 
| 10 ANALYSE DE VARIANCE 
[11 Degré de libert mme des carisenne des car F Valeur critique de F 

12 |Régression 2 02960689 0,14803445 52,7580592 2 46678E-05 
| 13 /Résidus 8 002244729) 0,00280591 
| 14 Total 10 0,31851619 
115 
| 16 Coefficients | Erreur-type | Statistique t| Probabilité | Limite inférieure pour seuil de confiance = 95% |Limite supérie 
[17 Constante | -6,84817203 0707927682 -9,67354555) 1,0869E-05 -8,480657568 
| 18/LYP 249262665, 0,25147946) 9,91184998  9,0679E-06 1912713611 
| 19 |LRPR -0,71303432  0,30943693 -2,30429616  0,05013349 -1,42659761 
| 20 

21 


de 1%, les quantités en question augmentent de 2,492627 %. L'élasticité des quantités 
vendues de boisson au cola par habitant à son prix relatif est mesurée par B; et sa valeur 
estimée vaut —0,71303 : par conséquent, si le prix augmente de 1 %, les quantités en 
question diminuent de 0,71303 %. R? est égal à 0,929525 : en d’autres termes, 92,9525 % 
des fluctuations des quantités vendues en logarithmes sont expliquées par les fluctuations 
du revenu disponible réel en logarithme et du prix relatif en logarithme, sur la période 
1970-1980. 


L'écart type estimé de l’estimateur BMCO est égal à 0,707928, celui de BMCO à 0,251479 et 
celui de 8} à 0,309437. Plus l’écart type de l’estimateur d’un coefficient est élevé, plus 
grande est l’imprécision avec laquelle le coefficient est estimé. Pour évaluer si l'écart type 
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estimé est grand ou petit, comparez-le à la valeur estimée du coefficient. La colonne f Stat a 
permet cette comparaison puisque f-stat — coefficient estimé/écart type estimé. Donc, 
plus une f-stat est élevée, plus la précision de l’estimation du coefficient concerné est 
grande. De manière générale, à partir de 2, la précision est bonne et, en dessous de 1, 
elle est très insuffisante. Les écarts types estimés par les logiciels ne sont fiables que si 
le terme d’erreur n’est ni autocorrélé ni hétéroscédastique car ils sont calculés à l’aide 
d’une formule qui n’est correcte que si le terme d’erreur est un bruit blanc. Par ailleurs, en 
supposant que ce dernier est distribué normalement, et en absence d’autocorrélation et 
d’hétéroscédasticité, vous ne pouvez rejeter l'hypothèse qu’un coefficient « vrai inconnu » 
est nul si sa f-stat est inférieure à la valeur critique à 5 % d’une distribution Student 
à 8 — 11(observations) — 3(coefficients) degrés de liberté. Dans ce cas, la probabilité 
critique (p-value en anglais) fournit le résultat puisque vous ne rejetez pas l’hypothèse 
qu'un coefficient « vrai inconnu » est nul si la probabilité critique est supérieure à 0,05. 
Mais comment savoir si le terme d’erreur n’est ni autocorrélé, ni hétéroscédastique, et 
s’il est distribué normalement? Utilisez les tests d’absence d’autocorrélation, d’absence 
d’hétéroscédasticité et de normalité du terme d’erreur (voir plus loin). 


Extrapolation avec un tableur 


Vous allez réaliser une extrapolation des valeurs des quantités vendues par l’entreprise de 

boisson au cola pour les années 1981 à 1990, en utilisant Excel. 

Pour cela, il faut d’abord poser les hypothèses suivantes sur l’évolution des variables 

explicatives, de 1981 à 1990 : 

+ L'entreprise envisage d'augmenter son prix de vente (PRICE) de 10 % chaque année. 

+ L'indice des prix à la consommation (CPI) va augmenter de 8% annuellement. Ces 
hypothèses supposent que le prix relatif (RPR) augmente de 2 % par an. 

+ Le revenu disponible réel par habitant (YP) va augmenter de 2 % chaque année. 

+ La population va augmenter de 1,5 % chaque année. 

Dans le fichier limonade.xis, affichez la feuille initiale (appelée ici limonade). Prolongez 

les dates de la colonne A, inscrivez les valeurs supposées de YP, PRICE, CPI pour les années 

1981 à 1990 en colonnes G, G et K, et calculez leurs implications sur RPR en colonne L, 

à partir de la ligne 15. Calculez les valeurs supposées de LYP et LRPR de 1981 à 1990, en 

colonnes N et O (voir figures 3.12, page suivante et 3.13, page suivante). 

Maintenant que les hypothèses sur les variables explicatives, de 1981 à 1990, sont posées, 

il est possible d'utiliser le modèle estimé pour calculer les valeurs de LRS qui en résultent, 

pour 1981 à 1990. Les résultats de l’estimation du modèle sont dans la feuille OLS du 

fichier limonade.xls. En particulier, les coefficients estimés sont donnés par les cellules 

suivantes de cette feuille : BMCO — OLS1$B$17, BHO — OLS!$B$18, BYCO — OLS!$B$19. 

Il faut calculer les prévisions de LRS à l’aide des formules suivantes : 


LR = BN 9 + RS COLYP ie + B3 © LRPRigg 


LS = BA + BNCOLYPIE, + BNCOLRPRIR 


LRSS = BI T BY COLYP La Ar FACRURE Ro 


Faites les modifications qui s’imposent dans la feuille limonade du fichier limonade.xls 
(voir figure 3.14, page 103). 
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M) tue béton Gffshoge luertin Form, Qui Gordes Frolum 2 Acobw x 
Dé em n-@rzrtAWme “lus -0- 612$ FER YPxmAAdœE _-à-A-. 
se | = RPR 
A B C D E E G = 

14 

15 1981 =C12*1,015 =F12"1,1 =G12*1,08 

16 1982 =C15*1,015 =F15"1,1 =G15*1,08 

17 1983 =C16*1,015 =F16*1,1 =G16*1,08 

18 1984 =C17*1,015 =F17*1,1 =G17*1,08 

19 1985 =C18*1,015 =F18*1,1 =G18*1,08 

20 1986 =C19*1,015 =F19*1,1 =G19*1,08 

21 1987 =C20*1,015 =F20*1,1 =G20*1,08 

22 1988 =C21*1,015 =F21*1,1 =G21*1,08 

23 1989 =C22*1,015 =F22*1,1 =G22*1,08 

24 1990 =C23*1,015 =F23*1,1 =G23*1,08 

25 

26 c 
K 4.» M\ CS } Sheet1 { Sheetà / Sheet3 / lai RE 
Prût NM 
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Figure 3.13 ElMicrosoft cal: Jimonede Ex 
M) tte Lüten Gffchoge lrmerticn Form, Qui Dordes Frodtre 2 Adobe =le1x) 
De eme EE nn Lan 0.615 FF3RYWxmAmœæL-2-A-. 

AVE + E 

| | K L M N O PQ À El 
14 
15 =K12*1,02  =F15/G15 =LN(K15) =LN(L15) 
116 /=K15*1,02 =F16/G16 =LN(K16) =LN(L16) 
17 =K16*1,02 =F17/G17 =LN(K17) =LN(L17) 
18 =K17*1,02 =F18/618 =LN(K18) =LN(L18) 
19 =K18*1,02 =F19/G19 =LN(K19) =LN(L19) 
20 =K19*1,02 =F20/G20 =LN(K20) =LN(L20) 
21 =K20*1,02 =F21/G21 =LN(K21) =LN(L21) 
22 =K21*1,02 =F22/G22 =LN(K22) =LN(L22) 
23 =K22*1,02 =F23/G23 =LN(K23) =LN(L23) 
24 =K23*1,02 =F24/G24 =LN(K24) =LN(L24) 
25 
26 c 
14 4.» M\ CLS } Sheet1 { Sheetà / Sheet3 / | es 
pi 
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Il reste à transformer les prévisions de LRS (les cellules M15 à M24) en prévisions pour 
les ventes nominales totales (SALES) de la manière suivante : 


SALES"y = POPio81 * PRICEn981 * (es) 


SALES?) = POP982 * PRICE1982 * (Si) 


SALES/ 0 = POP1990 * PRICE1990 * (ax) 
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Figure 3.14 Ei Microsoft Excel - limonade sx 
M) Ext Léton Affchoge Aérien Form Qui Qorrdes Fegéte 2 Adobe =l1x) 
Dé em -@Qrrt41Wm “lus -0u-617$S FF2RYPxmaAndœEæ L.8.A.. 
ar 
MS __»| = 


14 

15 =F15/G15 =OLSI$B$S17+OLSIB18*Sheet1IN15+OLSIB19*Sheet11015 
16 =F16/616 =OLSI$B$17+OLSIB18*Sheet1IN16+OLSIB19*Sheet11016 
17 =F17/G17 =OLSI$B$17+OLSIB18*Sheet1IN17+OLSIB19*Sheet11017 
18 =F18/G18 =OLSISB$17+OLSIB18*Sheet1IN18+OLSIB19*Sheet11018 
19 =F19/G19 =OLSI$B$S17+OLSIB18*Sheet1IN19+OLSIB19*Sheet11019 
20 =F20/G20 =OLSI$B$17+OLSIB18*Sheet1IN20+OLSIB19*Sheet11020 
21 =F21/G621 =OLSI$B$17+OLSIB18*Sheet1IN21+OLSIB19*Sheet11021 
22 =F22/G22 =OLSISB$S17+OLSIB18*Sheet1IN22+OLSIB19*Sheet11022 
23 =F23/G23 =OLSI$B$17+OLSIB18*Sheet1IN23+OLSIB19*Sheet11023 
24 =F24/G24 =OLSI$B$17+OLSIB18*Sheet1IN24+OLSIB19*Sheet11024 
[al 

26 


4» PIN CUS } Sheet1 { Shest3 / Sheet / ——_—_—_— | CET 
mt 
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Pour cela, il faut introduire pour commencer les formules de calcul des valeurs supposées 
de la population de 1981 à 1990, puis insérer les formules de calcul des prévisions de 
SALES (voir figure 3.15). 


Figure 3.15 PP : 
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15 1981  =EXP(M15)C15*F15  =C121,015 27121, 
16 1982  =EXP(M16)"C16-F16  =C15*1,015 =F151, 
17 1983  =EXP(M17)C17-F17  =C16"1,015 =F16"1 
18 1984  =EXP(M18)"C18-F18  =C17"1,015 2171 
19 1985  =EXP(M19)C19-F19  =C18*1,015 =F18"1 
20 1986 =EXP(M20)-C20*F20  =C19“1,015 =F19"1, 
21 1987 =EXP(M21)C21*F21  =C201,015 =F20"1, 
22 1988 =EXP(M22)-C22"F22 =C21*1.015 2214 
23 1989 =EXP(M23)-C23*F23  =C22“1.015 =F221, 
24/1990 =EXP(M24-C24*F24 =C231015 [|] =F23, 
25 
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Inscrivez dans une cellule surmontant les valeurs extrapolées de SALES la mention SALES- 
FRCST pour les désigner. 


Vous obtenez les valeurs suivantes : 
6294,69848 
7287,66/761 
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8437,27454 
9768,22839 
11309,1361 
13093,1172 
15158,5157 
17549,7245 
20318,139 
23523 ,2623 


Estimation et extrapolation avec TSP 


Avec TSP, le principe et la procédure sont différents : créez un nouveau fichier Excel, dans 
lequel vous recopiez certaines données historiques du fichier initial limonade.XLS, en 
l'occurrence seulement celles dont vous avez besoin dans l’analyse : les dates, les données 
de SALES, Population, PRICE, CPI et Y. Sont donc exclues les données de GNP, CPI-FB et 
CT (vous pourriez insérer ces variables dans le fichier, même sans les utiliser par la suite, 
mais il faudrait alors changer le nom CPI-FB en CPIFB : TSP n’accepte pas les noms de 
variables contenant des tirets). 


Ajoutez l'en-tête DATE au-dessus de la colonne de dates. Changez le nom Population 
en POP parce que certaines versions anciennes de TSP n’acceptent que des noms de 
huit caractères maximum. Enregistrez le document comme un fichier de type feuille 
de calcul Excel (quelle que soit la version), sous le nom LIM (lordinateur lui donne 
automatiquement l’extension .xls), dans le répertoire C:\ de Pordinateur par exemple. 
Fermez-le pour pouvoir le lire avec TSP. Pour travailler sous TSP, suivez la procédure 
décrite au chapitre 2. Ici le programme d’instructions est le suivant : 


FREQ À; 

SMPL 1970 1980; 

? LECTURE DES DONNEES 
READ(FILE=’C :\LIM.XLS’); 
? CREATION DE VARIABLES 
RS=(SALES/POP)/PRICE; 
YP=Y/POP; 
RPR=PRICE/CP 
LRS=LOGCRS ) ; 
LYP=LOGCYP) ; 
LRPR=LOGCRPR) ; 

? CALCUL DE REGRESSION 
REGOPT(PVPRINT,STARS) ALL; 


Hi 


LSQ LRS C LYP LRPR; 
YPOTHESES EN PREVISION 


0 

? H 

SMPL 1981 1990; 
YPEYREETIET 02: 
POP=POP(-1)*1.015; 
CPI=CPI(-1)*1.08; 
PRICE=PRICE(-1)*1.10; 
RPR=PRICE/CPI; 


Compléments sur les modèles linéaires 


LYP=LOG(YP) ; 
LRPR=LOGCRPR) ; 


PRINT SALESP:; 


Les lignes de code commençant par un point d'interrogation (?) sont des commentaires 
qui décrivent le programme (vous pouvez donc les ignorer lorsque vous réalisez cet 


? CALCUL DE PREVISION EN LOG SUR LES VENTES REELLES PAR HABITANT 
FORCST(PRINT) LRSP; 
? CALCUL DE LA PREVISION SUR LES VENTES NOMINALES TOTALES 
SALESP=EXP(LRSP)XPOPXPRICE; 


exercice). Les résultats sont les suivants : 


Mean of dependent variable = .510351E-02 
Std. dev. of dependent var. = .178470 
Sum of squared residuals = .022447 

Variance of residuals = .280592F-02 
Std. error of regression = .052971 
R-squared = .929525 
Adjusted R-squared = .911907 
Durbin-Watson statistic = .961980 


Breusch/Godfrey 


Wald nonlin. 


LM 


: AR/MAI = 1.97215 [.160] 
Ljung-Box Q-statisticl = 1.12998 [.288] 
AR vs. 

ARCH 

CuSum 
CuSumsq 
Chow 


Tags = 5.16845 C.075] 
test = 1.66231 [.197] 
test = .7//70092 [.166] 
test = .487032 * [.037] 
test = 8.68049 * [.020] 


LR het. test (w/ Chow) = 26.9613 ** [.0001] 
White het. test = 1.11500 [.953] 

Jarque-Bera normality test = .118607 [.942] 
zero slopes) = 52.7580 **x [.0001 
ation Crit. = -2.81115 


F-statistic 
Akaike Inforn 
Schwarz Bayes. 


Info. 


Crit. = -5.54051 


Log of likelihood function = 18.4613 


Esti 

Variable Coeff 
C -6.84 
LYP 2.492 
LRPR A 13 
981 6294. 

982 7287. 

983 8437. 

984 9768. 

985 11309. 

986 13093. 

987 15158. 

988 17549. 

989 20318. 

990 23523. 


mated 

icient 
817 
63 
034 
SALESP 
69873 
66650 
27344 
23047 
13770 
11816 
51367 
73047 
14258 
26367 


Standard 
Error t-statistic P-value 
.707928 -9,67354 *x [,000] 
.251480 9.91184 *x [,000] 
.309437 -2.30429 [.050] 
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EXERCICE 3 


Vous retrouvez certains résultats déjà obtenus précédemment, mais des tests permettent de 
mieux apprécier leur validité. Deux des trois tests d’hétéroscédasticité ont une probabilité 
critique supérieure à 0,05 et ne rejettent donc pas l'hypothèse que le terme d’erreur n’est 
pas hétéroscédastique. Il s’agit des tests ARCH (qui est peu pertinent ici sur des données 
annuelles) et du test White het. Les tests de Breusch et Godfrey, de LM : AR/MAI et de 
Ljung et Box (Q-statisticl) ont une probabilité critique supérieure à 0,05 et ne rejettent 
donc pas l’hypothèse que le terme d’erreur n’est pas autocorrélé. Le terme d’erreur semble 
être un bruit blanc, ce qui permet d’affirmer que les écarts types estimés de la colonne 
standard errors sont fiables. Les t-stats élevées montrent que les coefficients sont estimés 
d’une manière précise. 


LE CAS BANQUE RÉGIONALE FRANÇAISE 


Énoncé 


Une agence urbaine d’une grande banque régionale française (1) souhaite, en octobre 2001, 
mettre au point une méthode de prévision de ses volumes mensuels de production de 
crédits octroyés sous forme de prêts personnels. Cette agence est située dans le centre 
d’une grande métropole. Les données disponibles en provenance de cette banque sont : 


* une série temporelle mensuelle avec le volume observé de production de crédits de 
l'agence Lille Métropole, de janvier 1999 à septembre 2001 (35 mois) ; 


+ des séries temporelles mensuelles de l’encours, des rachats et des échus de crédits de 
cette agence pour les mêmes mois; 


+ des séries temporelles mensuelles de la marge sur les crédits produits et de la marge sur 
les crédits en cours de l’agence pour les mêmes mois. 


Ces données sont sur la première feuille du fichier BA.XLS : 


+ en colonne A, la variable date : les dates successives de novembre 1998 à septembre 
2001; 


+ en colonne B, la variable pp_pro : la production de prêts personnels ; 

* en colonne C, la variable pp_enc : l’encours des prêts personnels ; 

- en colonne D, la variable pp_ ra : les rachats de prêts personnels ; 

- en colonne E, la variable pp_ec : les échus de prêts personnels; 

- en colonne F la variable pp_pro_m : la marge sur la production des prêts personnels ; 
- en colonne G, la variable pp_enc_m : la marge sur l’encours des prêts personnels. 


Pour chaque colonne, le nom de la variable est en ligne 1 ; les trente-cinq observations 
successives viennent sur les lignes suivantes. 


Exploration d’une première piste 


Pour élaborer une méthode de prévision de la production de crédits prêts personnels 
pour lagence bancaire, il faut d’abord comprendre les facteurs qui peuvent expliquer 
l’évolution de cette production. 


1. Il s’agit d’une demande réelle traitée à l’TESEG pour le compte d’une agence d’une grande banque régionale 
française. Celle-ci ayant souhaité la confidentialité, son identité ne sera pas divulguée ici. La méthodologie de 
prévision devait être mise au point pour trois catégories différentes de crédits : les prêts acquéreurs, qui sont 
des prêts hypothécaires, les prêts personnels et les prêts équipements MLT (Moyen Long Terme), qui sont des 
prêts accordés à des entreprises et à des artisans pour l’achat de biens d’investissement. 


Compléments sur les modèles linéaires 


Figure 3.16 


Chile 


Si les productions de crédits prêts personnels de l’agence et de l’ensemble des banques 
de France semblent suivre globalement la même évolution, vous pouvez expliquer la 
production de crédits de l'agence par les mêmes facteurs que ceux qui influencent la pro- 
duction totale de crédits en France. Il s’agit de facteurs nationaux globaux relativement 
bien connus, faisant l’objet de statistiques publiées par des organismes officiels comme 
INSEE, le FMI, l'OCDE. Pour vérifier que la production de crédits de l’agence concernée 
suit la tendance nationale, vous allez comparer graphiquement son évolution à celle de la 
production de crédits prêts personnels de l’ensemble des banques de France. Cette variable 
nationale figure dans les statistiques financières internationales du FMI : elle s'intitule FR 
BANK LENDING TO HOUSEHOLDS AS PERSONAL LOANS CUR. Ajoutez ces données 
à la colonne H du fichier CN.XLS, avec comme nom l’abréviation lehpl. Comparez alors 
la production de prêts personnels de l’agence avec la production nationale, représentées 
sur un même graphique (voir figure 3.16). 
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La production de crédits en prêts personnels de l’agence ne suit pas la tendance nationale. 


Remarque 


Les divergences entre évolution de l'agence et évolution nationale ne viennent pas de la 
différence entre le caractère lisse de la série nationale et le caractère erratique de la série 
de l'agence, qui s'explique par le fait que la série nationale est « corrigée des variations 
saisonnières », ce qui n’est pas le cas de la série de l'agence. Elles sont dues à la tendance 
croissante affichée par la série nationale (et non par la série de l'agence] tout au long de la 
période. 


Les conclusions de l’examen graphique sont les suivantes : 


1. L'évolution mensuelle des crédits de agence semble essentiellement due à des facteurs 
locaux plutôt que nationaux, ou à des facteurs spécifiques à l’entreprise et affectant sa 
part de marché dans la région. 


2. L'évolution des crédits de l’agence semble présenter des fluctuations saisonnières. 
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Fluctuations saisonnières 


Pour vérifier la présence de fluctuations saisonnières dans la série de production de 
crédits de l’agence bancaire, vous allez réaliser une nouvelle analyse graphique. Recopiez 
les données de la série pp_pro dans une nouvelle feuille du fichier BA, en la subdivisant 
en sous-variables correspondant à chaque année (voir figure 3.17). 
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pp_pro_99 pp_pro_ 00 pp_pro_01 


1 
2 janvier 5108 4336 4605 
3 février 5742 5484 5652 
4 mars 7002 6466 6984 
5 avril 6480 5495 6212 
6 mai 7231 6283 5856 
7 juin 6685 6307 6638 
| 8 |juillet 4922 4635 5518 | 
9 août 3377 3899 3878 
10 septembre 5736 6620 4654 
11 octobre 4653 7877 
12 novembre 4920 5282 
13 décembre 4840 4783 


15 
16 
17 
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Représentez ces sous-séries sous forme graphique en fonction de la première colonne, à 
savoir le mois (voir figure 3.18). 


Figure 3.18 Fe ; 
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Un profil saisonnier systématique se répète clairement chaque année. 


Modélisation et extrapolation 


Sur la base des observations graphiques et d’un raisonnement économique élémentaire, 
spécifiez un modèle où l’évolution de pp_pro est expliquée par : 


Compléments sur les modèles linéaires 


Figure 3.19 


+ des fluctuations saisonnières représentées par des variables dummy saisonnières ; 


Ch 


+ le taux de marge, appliqué par la banque sur le coût de ses fonds et utilisé pour fixer le 
taux d’intérêt des crédits ; 


+ la valeur de pp_pro au mois précédent. 


Le coefficient du taux de marge devrait être a priori négatif : si la banque réduit sa marge, 
et est donc prête à proposer des taux plus bas, elle peut attirer davantage d’emprunteurs. 
Vous devez d’abord préparer les données pour pouvoir estimer le modèle. À la suite des 
colonnes déjà remplies dans la feuille de données, recopiez en colonne K les dates à partir 
de décembre 1998, en commençant à la ligne 2. Puis, pour chaque date, complétez le 


tableau de la façon suivante : 


+ Recopiez la variable dépendante pp_pro en colonne L. 


+ Écrivez les onze variables dummy saisonnières, appelées D1, D2... D11, en colonnes M 


à W. 


+ Recopiez la variable pp_pro_m en colonne X. 


+ Recopiez la variable dépendante retardée d’une période — appelez-la pp_pro(—1) - en 


colonne Y. 


Les variables dummy saisonnières sont définies de la manière suivante : 


D1 vaut 1 pour janvier et 0 pour tous les autres mois. 


D2 vaut 1 pour février et 0 pour tous les autres mois. 


DI1 vaut 1 pour novembre et 0 pour tous les autres mois. 
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5, mars-99 7002 O0 O 1 O0 O0 O0 0 O0 0 () 0 3,45 5742 

6 avr-99 6480 0 0 0 1 0 0 0 0 0 0 0 3.42 7002 

7 mai-99 7231 O0 © O0 © 1 O0 0 © oO (e) 0 3,28 6480 

8 juin-99 6685 O0 O0 O0 OO 0 1 0 O0 0 0 0 3,2 7231 

8 jui 99, 4922 O0 O0 ©O O0 O0 O0 1 0 0 0 0 3,19 6685 

10 août-99 3377 O0 O0 O0 © 0 0 0 1 0 0 0 3,19 4922 

1 sept-99 5736 0 O0 O0 0 0 0 0 O0 1 (e) () 3,18 3377 

12 oct-99 4653 0 0 O0 O0 0 0 0 © 0 1 0 3.13 5736 

13  nov-99 4920 0 O0 0 © 0 O0 0 0 0 (e) 1 3,11 4653 

14  déc-99 4840 O0 OQ O0 © 0 O0 0 © oO 0 0 3,07 4920 

15 janv-00 4336 1 O0 O0 O0 0 0 0 0 0 (e) 0 3,04 4840 

16! févr-00 5484 0 1 0 0 0 0 0 O0 0 0 0 2,66 4336 

17 mars-00 6466 0 O0 1 0 0 O0 0 O0 0 (9) 0 2.65 5484 
Le] avr-00 5495 0 0 O0 1 0 0 0 © 0 0 0 2,54 6466 

19 mai-00 6283 O0 O0 O0 O© 1 O0 0 O0 O0 (e] 0 2,47 5495 

# juin-00 6307 O0 O © O©O O0 1 0 © oO (e) 0 2,43 6283 

2 jui-00 4635 0 0 O0 0 0 0 1 0 0 (e) 0 2,35 6307 

2  aoû-00 3899 O0 O0 0 O0 0 0 0 1 0 0 0 2,32 4635 

23 sept-00 6620 0 O0 O O0 O0 0 0 0 1 0 0 2.3 3899 

24 oct-00 7877 O © 0 O0 0 0 0 O0 0 1 0 2,22 6620 
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Commencer à la colonne K est un choix arbitraire. Vous pourriez commencer à la colonne 


(voir figure 3.19). 


Vous pouvez maintenant estimer le modèle. Cliquez successivement sur Outils 
(Tools)/Utilitaire d’analyse (Data analysis)/Régression linéaire (Regression) et remplissez 
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le tableau. Dans Plage pour la variable Y, écrivez $L$1:$L$35 pour définir les cellules 
des observations de la variable dépendante. Dans Plage pour les variables X, entrez 
$M$1:$Y$35 pour définir les cellules des observations des variables explicatives. Cochez 
Intitulé présent. Cochez Insérer une nouvelle feuille et écrivez results_pp. Cliquez sur OK. 
Les résultats s'affichent dans la feuille results_pp. 


Puisque R? = 0,765, 76,5% de la variabilité observée de pp_pro est expliquée par la 
variabilité des variables explicatives. Le coefficient estimé de la variable explicative vaut 
—137 ; il est donc négatif comme prévu : si la banque augmente ses marges, elle décourage 
des candidats emprunteurs. Toutefois, l’imprécision de l’estimation de ce coefficient, 
donnée par son écart type (standard errors) est énorme. Sa f-stat est donc petite et la 
probabilité critique (p-value) de sa t-stat est supérieure à 0,05 : vous ne pouvez rejeter 
l'hypothèse que le coefficient vrai de Il_pro_m soit nul. Pour autant, il n’est pas sûr qu’il 
soit nul : cela signifie simplement que 0 fait partie de l’ensemble de valeurs qui ne sont 
pas rejetées par le test (les valeurs d’un intervalle de confiance à 90%). L'interprétation 
correcte du test est que le coefficient de IL_pro_m est compris dans un certain intervalle 
de confiance, avec une probabilité de 0,9. Toutefois, cet intervalle est trop large, si bien 
que vous ne pouvez montrer statistiquement si ce coefficient est négatif, nul ou positif. 


Il peut alors être légitime de supprimer pp_pro_m des variables explicatives et d’estimer 
de nouveau le modèle. Supprimez donc la colonne X dans la feuille de données : la variable 
pp_pro(—1) vient occuper la colonne X. Cliquez sur Outils puis sur Régression linéaire. 
Dans Plage pour la variable Y, écrivez $L$1:$L$35 pour définir les cellules des observations 
de la variable dépendante. Dans Plage pour les variables X, écrivez $M$1:$X$35 pour 
définir les cellules des observations des variables explicatives. Cochez Intitulé présent puis 
Insérer une nouvelle feuille, et écrivez results_pp2. Cliquez sur OK. Les résultats s’affichent 
dans la feuille results_pp2. 


Ensuite, utilisez ce modèle estimé pour prévoir la production de crédits prêts personnels 
d’octobre 2001 à décembre 2002. Dans la feuille de données, prolongez les dates à la 
colonne K et les variables dummy aux colonnes M à W, pour les lignes 36 à 50. Recopiez 
aussi les coefficients estimés de la feuille results_pp2 dans la feuille de données, aux 
cellules J36 à J48. Calculez alors la valeur de pp_pro en utilisant les coefficients estimés du 
modèle. En ce sens, dans la cellule L36, écrivez la formule pour pp_pro en octobre 2001 : 


=$J$36+$J$3/7*M36+$J$38*N36+$J$39*036+$J$40*P36+$J$41*036+$J$42*R36 
+$J$43*S36+$J$44*T36+$J$45*0U36+$J$46*V36+$/$4/7*W36+$J$48*L35 


Dans la cellule L37, écrivez la formule pour pp_pro en novembre 2001 : 


=$J$36+$J$3/7*M3/+$J$38*N3/+$J$39*03/7+$J$40*P3/7+$J$41*03/+$J$42*R37 
+$0/$43*S37+$J$44XT37+$J$A5XU3/7+$J$46*V37+$J$47*W37+$J$48*L36 


Réitérez jusqu’à la cellule L50, dans laquelle vous écrivez la formule pour pp_pro en 
décembre 2002 : 


=$J$36+$J$3/7*M50+$J$38*N50+$J$39*050+$J$40*P5S0+$J$41*050+$J$42*R50 
+$J$43*S50+$J$44*T50+$J$45*U50+$J$46*V50+$)$4/7*W50+$/$48*L49 


Vous obtenez des valeurs extrapolées pour la production de prêts personnels (voir 
figure 3.20, page ci-contre). 


Compléments sur les modèles linéaires 


Figure 3.20 


Ch 


ElMicrosoft Excel CN [MCIL3 
tte éten éffchage met Form Qui Qorrdes Froftre 2 Acrobat =ieixl 
Dés en Ar! -0-167$ FF WXxmAMEEæL-d-A-. 
ae 
Y44 pa | = 
i K Î MINTOIPFIGTR]S] T1] U V W x VE 

El mai-01 5856 0 O0 O0 O0 1 0 0 O0 O0 0 (e] 6212 

7 juin-01 6638 0 O0 O0 0 O0 1 0 O0 O0 0 (e] 5856 

pe) jui-01! 5518! 0! 0! O0 0! 0) O0] 1}, 0 0 0 0 6638 

x août-01 3878 O0 O0 © O0 O0 © O0 1 0 0 0 5518 

5 sept-01 4654 0 0 0 O0 0 0 0 0 1 0 0 3878 

% 2906,9653  oct-01 5677 0 0 O0 0 0 0 0 0 0 1 0 

3 -126,89974 nov-01 4874 0 0 © 0 0 0 0 0 0 0 4 

æ 91266132 déc-01 4787 O0 O0 O0 O0 0 0 0 0 0 0 0 

æ 1740,2513 janv-02 4627 1 0 O0 0 0 0 0 0 0 0 0 

«a 52571833 féevr02 5604 0 1 O0 O0 0 0 0 O0 0 0 0 

ai 12112778 mars-02 6809 O0 O0 1 O0 O0 O0 0 0 0 0 0 

42 11458383 avr-02 6059 O0 0 O0 1 0 0 0 0 0 0 0 

43: -405,92499  mai-02 6455 0 0 0 0 1 0 0 0 0 0 0 
Lul -1127,2583  juin-02 6543 0 0 O0 O0 0 1 0 O0 0 0 0 

«5 1328,8907 juil-02 5025 0 0 0 0 0 0 1 0 0 0 0 

«5 97499503 aoùt-02 3718 0 0 O0 O0 0 O0 0 1 0 0 0 

a -222,56348 sept-02 5670 0 O0 O © © © 0 O0 1 0 0 

4# 0.38573 oct-02 6069 O0 0 ©O O0 0 0 0 0 0 1 0 

4 nov-02 5025 0 0 0 0 0 © 0 0 0 0 1 

5 déc-02 4845 0 O0 0 © 0 0 0 0 0 0 0 

AH » LbIN Sheet19 Z rendts pp { resuts pp 2 }\Sheet1 { £heet2 { Éhestà { Chart { Sheet4 { SheetS { Sheeté { Sheet? / heat { €h| « FN © DT 
Prêt NM 


rer 
‘1 démarrer 2 Here - Marosndt Mort EX Merosoit Excel - CN 


EXERCICE À LE CAS PRODUCTEURS D'ÉLECTRICITÉ 


Énoncé 


Des investisseurs privés envisagent de financer une nouvelle usine de production d’élec- 
tricité, d’une certaine capacité de production de kilowatts à l'heure. Avant de se décider et 
de fixer la taille de l’usine, ils souhaitent avoir la réponse à plusieurs questions, dont celles- 
ci : comment évoluent le coût total d’une centrale électrique en fonction de la quantité 
produite? En d’autres termes, de quelle nature sont les rendements? Quel est l'impact 
d’une augmentation de 1 % du prix du fuel sur le coût total, après une réorganisation 
optimale suite à cette augmentation? 

Comme informations, ils disposent en particulier de la production et du coût total de 
production des usines électriques déjà installées. Il s’agir des données de cent vingt-trois 
sociétés productrices d'électricité américaines rassemblées en 1970 et utilisées par L. Chris- 
tensen et W. Greene [CHR 1984]. Elles se trouvent dans le fichier EL.xls téléchargeable 
sur le site Internet www.pearsoneducation.fr. Les variables sont les suivantes : 


OUTPUT : la production de la centrale électrique ; 
PRICELAB : le prix d’une unité de travail ; 
PRICECAP : le prix d’une unité de capital physique ; 
PFUEL : le prix d’une unité de fuel ; 

COST : le coût total de production de la centrale. 
Travaillez avec TSP. 


Une production Q = OUTPUT est fabriquée à partir de trois inputs : x, = LABOR, 
X1 = CAPITAL, x; = FUEL, selon une technologie représentée par une certaine fonction 
de production : Q = F(x1,x2, x3). Supposez que la technologie de production d'électricité 


peut être représentée par une fonction de production Cobb-Douglas : Q = Ax}'x}?x}°. 
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Les rendements d’échelle sont constants si y; + y2 + y3 = 1. Ils sont croissants si 
Y1 + Y2+y3 > let décroissants si y1 + y2 + y3 < 1. En toute logique, vous pouvez 
supposer que les entreprises productrices d'électricité agissent rationnellement, et donc 
qu’elles minimisent leurs coûts de production. Cela veut dire qu’une entreprise, pour 
produire un montant Q d'électricité, choisit une quantité x; de travail, une quantité x de 
capital et une quantité x; de fuel de manière à minimiser le coût de production. Chaque 
entreprise résout donc le problème : mins. ,x,x3 PiX1 + P2X%2 + p3x3 sous la contrainte 
Q = Ax}x}2x}°, où p. est Le prix d’une unité de travail, p; le prix d’une unité de capital 
et p; le prix d’une unité de fuel. Vous pouvez encore représenter ce problème avec un 
multiplicateur de Lagrange : mins,,,x3,2 P1X1 + P2X2 + P3X3 + À (Q — AxT'x?x}). Les 
conditions de premier ordre de ce problème de choix optimal sont :p, = ky1Ax!1" !x?2x", 
pa = XBAX 8 ps = AB A x x let Q = AxŸ1xŸ2xŸ5, Ces conditions forment 
un système d’é chan dont les solutions sont : 
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Le coût total de production d’une quantité Q d'électricité, noté COST, est donné par : 


COST a + p2%2 + p3%3 


Cela implique que : 


COST = Sr 1 pY2 p}3 TS Pi Y3 T3 Y2+#Y3. V2. ,—V3 os 
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Vous pouvez en déduire la relation en logarithmes suivante : 


In COST = Bi + B2 In Q + B3 In pi + Ba In p2 + B5 np; 


B, =In (Cars ÿs à si ï (rpm) TES PES El 
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Si toutes les entreprises i ont la même technologie de production, la détermination de 
leurs coûts peut donc être représentée ainsi : 


In COST; = B1 + B2 In Q; + B3 In pi; + Ba In pa; + B5 In ps; + u; 


pour tout i = 1...123, où le terme d’erreur u; représente la partie du logarithme du coût 
de l’entreprise j qui ne s’explique pas en fonction des logarithmes de la quantité produite 
et des prix des inputs, de la manière décrite par le raisonnement précédent. Il s’agit d’une 
régression linéaire sur des données en coupe instantanée. L'estimation des coefficients 
inconnus f;, par la méthode des MCO, se fait au moyen des instructions TSP suivantes : 
FREQ N; 

SMPL 1 123; 

READ(FILE=’C:\EL.XLS’); 

LC=LOG(COST) ; 

LO=LOGCOUTPUT) ; 

LL=LOG(PRICELAB) ; 

LK=LOG(PRICECAP) ; 

LP=LOG(PFUEL) ; 

NOPLOT ; 

LSQ LC C LQ LL LK LP; 


[e 


Les résultats sont les suivants : 


Equation 1 


Method of estimation = Ordinary Least Squares 


Dependent variable : LC 
Current sample : 1 to 123 
Number of observations : 123 

Mean of dep. var. = 2.96715 LM het. test = 1.93386 [.164] 
Std. dev. of dep. var. = 1.52498 Durbin-Watson = 1.833427 [<.000] 
Sum of squared residuals = 5.35831 Jarque-Bera test = 63.34/78 [.000] 
Variance of residuals = .045409 Ramsey’s RESET2 = 150.297 [.000] 
Std. error of regression = .213095 F (zero slopes) = 1532.51 [.000] 


R-squared = .981114 Schwarz B.I.C. = -6.15258 
Adjusted R-squared = .980474 Log likelihood = 18.1830 
Estimated Standard 
Variable Coefficient Error t-statistic P-value 
C -/.87891 1.29467 -6.08567 [.000] 
LQ .826268 .010949 75.4667 [.000] 
LL .099547 .130458 ./63058 [.447] 
LK .192253 .130/796 1.46987 [.144] 
LP ./09348 .073380 9.66676 [.000] 


Ignorez la valeur du test de Durbin et Watson puisque le concept d’autocorrélation des 
erreurs ne s'applique pas à des régressions utilisant des données en coupe instantanée. Les 
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EXERCICE 5 


Énoncé 


99,11 % de la dispersion des logarithmes des coûts entre les différentes entreprises sont 
expliqués par la dispersion des logarithmes des variables explicatives (prix du travail, du 
capital et du fuel, production). Cette excellente performance du modèle le rend fiable pour 
la problématique considérée : vous pouvez l'utiliser pour répondre aux questions initiales. 
Par ailleurs, les rendements sont croissants dans l’industrie de production d'électricité 
puisque : 


x " + 1 1 
M +Y+Y => 


Une augmentation de 1% du prix du fuel entraîne une faible augmentation de 0,71 % 
du coût total de production, mais seulement après que la combinaison des quantités de 
facteurs ait été modifiée pour minimiser les coûts, en réponse à la nouvelle structure des 
prix. 


LE CAS PRIX DES MAISONS 


Vous disposez des données suivantes pour cinq cent quarante-six maisons mises en vente 
à Windsor, Canada : 


PRIX : le prix de vente de la maison. 
SUPERFICIE : la superficie de la parcelle sur laquelle se trouve la maison. 
CHAMBRES : le nombre de chambres. 


SDB : le nombre de salles de bain. 

ETAGES : le nombre d’étages. 

ALLEE : cette variable vaut 1 si la maison est dotée d’une allée privative, et 0 sinon. 
SALLEJEU : cette variable vaut 1 si une salle de jeux est disponible, et 0 sinon. 

GAZ : cette variable vaut 1 si un raccordement au gaz est disponible, et 0 sinon. 
AIR: cette variable vaut 1 si un système d’air conditionné est installé, et 0 sinon. 


GARAGES: le nombre de garages. 
SITUATION : cette variable vaut 1 si la situation de la maison est particulièrement 
agréable, et 0 sinon. 

Toutes ces variables se trouvent dans le fichier MAISON.xls téléchargeable à partir du 
site Internet www.pearsoneducation.fr. Ces données ont été utilisées par Paul Anglin et 
Ramazan Gencay [ANG 1996]. Mettez au point un outil permettant d’évaluer le prix 
de vente potentiel d’une maison, en fonction des valeurs de toutes les autres variables. 
Travaillez avec TSP. 


Il faut d’abord spécifier un modèle linéaire reliant le prix de vente d’une maison à ses 
propriétés. Supposez que le prix de vente d’une maison est déterminé par le modèle 
suivant : 


PRIX; = Bi + B»SUPERFICIE; + B:CHAMBRES; + BiSDB; + BsETAGES; + BéALLEE; 
+ B;SALLEJEU; + BsGAZ; + BoAIR:; + B10GARAGES; + B11 SITUATION; + u; 


pour tout i = 1...546. La variable u; est un terme d’erreur inobservable. 
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Il s’agit d’un modèle linéaire reliant des variables en coupe instantanée. Il faut estimer les 
coefficients B; par la méthode des MCO. Le programme d’instructions TSP est le suivant : 


freq n; 

smpl 1 546; 

read(file=’c :\maison.x1s’); 

noplots; 

olsq prix c superficie chambres sdb etages allee sallejeu gaz air garages situation; 


Les résultats de l'estimation sont les suivants : 


Equation 1 


Method of estimation = Ordinary Least Squares 


Dependent variable : PRIX 
Current sample : 1 to 546 
Number of observations : 546 
Mean of dep. var. = 68121.6 LM het. test = 36.2854 [.000] 
Std. dev. of dep. var. = 26702.7 Durbin-Watson = 1.61923 [<.000] 
Sum of squared residuals = .129829E+12 Jarque-Bera test = 263.929 [.000] 
Variance of residuals = .242672E+09 Ramsey’s RESET2 = 20.5948 [.000] 


Std. error of regression = 15577.9 F (zero slopes) = 106.635 [.000] 
R-squared = .665908 Schwarz B.I.C. = 6074.72 
Adjusted R-squared = .659663 Log likelihood = -6040.06 
Estimated Standard 

Variable Coefficient Error t-statistic P-value 

C -3127.96 3433.25 -.911079 [.363] 

SUPERFICIE 3.452650 .352737 9.78776 [.000] 

CHAMBRES 2341.89 046.81 2.23716 [.026 

SDB 14819.3 498.12 9.89194 [.000 

ETAGES 5674.82 897.823 6.32064 [.000 

ALLEE 6886.53 2064.94 3.334198 [.001 

SALLEJEU 6793.14 797.79 3.77861 .000 

GAZ 13016.0 3249 ,42 4.00564 [.000 

AIR 12855.3 569.26 8.19195 [.000 

GARAGES 4287.96 848.882 5.05130 .000 

SITUATION 10460.9 654.98 6.32085 .000] 


Ce modèle peut être utilisé par des agents immobiliers lorsqu'ils doivent fixer le prix de 
vente de départ d’une habitation. Il faut d’abord rassembler les valeurs des différentes 
variables de droite (superficie...) pour la maison à vendre. Il suffit ensuite d’introduire les 
valeurs de ces variables dans la formule suivante : 


Prix de vente de départ = $; + B:SUPERFICIE; + 63 CHAMBRES; + B,SDB; 
+ BSETAGES,; + BsALLEE:; + B:SALLEJEU; 

+ BeGAZ; + BoAIR; + B10GARAGES,; 

+ 81 SITUATION; 


Remplacez les coefficients inconnus B; par leurs valeurs estimées du tableau de résultats. 
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EXERCICE 6 LE CAS PRIX DES HÔTELS 


Énoncé 


Figure 3.21 


Vous souhaitez savoir si le prix d’une nuitée dans une chambre d’hôtel d’une grande 
ville américaine dépend de la ville dans laquelle l'hôtel est situé, à qualité égale. Pour 
répondre à cette question, vous allez analyser des données des villes Los Angeles, Sans 
Francisco, Washington DC et New York. Pour chacune d’elles, vous disposez du prix 
d’une nuitée et du nombre d'étoiles de huit hôtels choisis au hasard dans cette ville. Les 
données se trouvent initialement dans la feuille 1 du classeur Excel Hotel.xls. Ce fichier 
est téléchargeable sur Le site www.pearsoneducation.fr. Les colonnes B, A et C contiennent 
respectivement les en-têtes Hotel, City, et Price en première ligne, puis les noms des 
différents hôtels, la ville où ils se situent et le prix d’une nuitée qu’ils tarifent sur les lignes 
suivantes. 


Solution avec un tableur 


Il s’agit d’une application de l’analyse de variance, ou ANOVA ; elle n’est qu'un cas 
particulier de la méthode des MCO avec variables indicatrices (ou dummy). Cette ANOVA 
est à un facteur. Pour pouvoir utiliser la fonction automatique Analyse de variance : un 
facteur d’Excel, recopiez d’abord les données nécessaires dans une autre feuille du classeur, 
chaque modalité de la caractéristique occupant une colonne (voir figure 3.21). 
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Sur cette nouvelle feuille appelée Feuil2, cliquez sur Outils puis sur Utilitaire d'analyse. 
Dans le menu déroulant, sélectionnez Analyse de variance : 1 facteur et cliquez sur OK. 
Cochez Intitulé en première ligne parce que les modalités (intitulés) de la caractéristique 
qualitative sont bien en première ligne. Écrivez $A$1$:$D$9 dans Plage d’entrée puisque ce 
sont les cellules contenant les données. Saisissez 0,05 comme Seuil de signification. Cochez 
Colonnes puis Insérer une nouvelle feuille, et nommez-la Anova 1 facteur. Cliquez sur 
OK. Les résultats s’affichent dans cette nouvelle feuille. La statistique F vaut 3,60702982. 
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La probabilité critique est 0,02548955, inférieure à 0,05. Rejetez donc l’hypothèse que 
l'espérance du prix d’une nuitée est identique pour les quatre villes. Ce prix dépend de la 
ville d'accueil. 


Solution avec TSP 


L'ANOVA à un facteur est une simple application de la régression linéaire. Sachant que : 
+ La variable dépendante est le vecteur des prix observés pour les trente-deux hôtels. 
+ Il n’y a pas de constante. 


+ Les variables explicatives sont quatre variables dummy se rapportant chacune à une 
ville. 


+ La variable dummy d’une ville particulière a trente-deux observations qui valent 0 si 
l'hôtel n’est pas dans cette ville et 1 si l'hôtel est dans cette ville. 
… estimez par MCO le modèle suivant : 


Prix; —= B.DU1; + B2DU); + B:DU3; + B4DUA4; + U;, pour i—;].;;:32 


… et testez l’hypothèse B, = B = B; = B, par un test F habituel. Ce test n’est valable 
que si u est distribué normalement. Chaque coefficient B; représente l’espérance de prix, 
E(Prix;), pour les hôtels de la ville j. 


Pour estimer ce modèle avec TSP, suivez la procédure décrite au chapitre 2. Recopiez 
la colonne C du fichier Hotel.xls dans la colonne A d’un nouveau fichier que vous 
enregistrerez dans C:\ comme une feuille de calcul Excel, sous le nom de HO. Ensuite, 
utilisez les instructions suivantes sous TSP : 
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Ce programme produit les résultats suivants : 


Dependent variable: PRICE 
Current sample: 1 to 32 
Number of observations: 32 
Mean of dep. var. = 155.063 LM het. test = .390756E-03 [.984] 
Std. dev. of dep. var. = 49.4681 Durbin-Watson 1.95603 [<.643] 
Sum of squared residuals = 54714.5 Jarque-Bera test = .833548 [.659] 
Variance of residuals = 1954.09 Ramsey’s RESET?2 = .850/706F+38 [.000] 
Std. error of regression = 44,2051 F (zero slopes) = 3.60703 [.025] 
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R-squared = .278743 Schwarz B.I.C. = 171.444 


Adjusted R-squared = .201465 Log likelihood = -164.512 
Estimated Standard 
Variable Coefficient Error t-statistic P-value 
DU 135.375 15.6289 8.66186 [.000] 
DU2 151.375 15.6289 9.68561 [.000] 
DU3 135.375 15.6289 8.66186 [.000] 
DU4 198.125 15.6289 12.6769 [.0001] 


Vous retrouvez dans ces résultats la statistique F avec sa probabilité critique. 


EXERCICE 7 CONSOMMATION ET SIMULTANÉITÉ 


Énoncé 


Comme au chapitre 1, il faut estimer un modèle linéaire expliquant le taux de croissance 
de la consommation réelle en fonction d’une constante, du taux de croissance du revenu 
disponible réel et du taux d’inflation, en utilisant les données du fichier USA.XLS. Tenez 
compte d’une probable simultanéité entre consommation et revenu, qui pourrait entraîner 
une dépendance entre le terme d’erreur du modèle et une variable explicative (le taux de 
croissance du revenu). Il faut donc estimer le modèle en utilisant des variables instrumen- 
tales, qui représentent la constante, les taux de croissance retardés de la consommation, 
du revenu et des prix, ainsi que le taux de chômage UR. Réalisez cette application avec 
TSP. 


Le programme permettant de réaliser cette estimation avec TSP est le suivant : 


REQ À; 

PL 1960 1994; 
EAD(FILE=’C :\USA.XLS'’); 
PL 1961 1994; 
LC=LOG(CT)-LOGCCT(-1)); 
LY=LOG(Y)-LOGCY(-1));: 
LP=LOG(P)-LOG(P(-1));: 
EGOPT(PVPRINT,STARS, LMLAGS=2,QLAGS=2) ALL ; 
OPLOT; 

PL 1962 1994; 
ST DEC C DLY DLP INVR C DLY(-1) DLP(-1) DLC(-1) UR; 
LSQ DLC C DLY DLP; 
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Certaines variables instrumentales choisies étant des variables en taux de croissance 
retardés d’une période, l'estimation par VI doit se faire à partir de 1962 plutôt que 
1961. Pour pouvoir comparer valablement les résultats à ceux obtenus par variables 
instrumentales, vous devez donc réaliser l'estimation par MCO à partir de 1962. 


Les résultats de l'estimation par variables instrumentales sont : 


Equation 1 


Method of estimation = Instrumental Variable 
Dependent variable: DLC 
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Endogenous variables: DLY DLP 
Included exogenous variables: C 
Excluded exogenous variables: DLY(-1) DLP(-1) DEC(-1) UR 
Current sample: 1962 to 1994 
Number of observations: 33 
Mean of dep. var. = .032166 
Std. dev. of dep. var. = .016776 
Sum of squared residuals = .279486E-02 
Variance of residuals = .931620F-04 
Std. error of regression = .965205E-02 
R-squared = .696993 
Adjusted R-squared = .676793 
Durbin-Watson = 1.77465 [.066,.565] 
E’PZXE = ,256476E-03 
Estimated Standard 


Variable Coefficient Error t-statistic P-value 
C .023945 .011354 2.10896 *. [20351 
DLY .561161 .224709 2.49728 * [.013] 
DLP -.761937 .170785 -4.46138 *x [,000] 


Ch 


Comparez ces résultats avec ceux obtenus par la méthode des moindres carrés ordinaires : 


Equation 2 


Method of estimation = Ordinary Least Squares 


Dependent variable: DLC 
Current sample: 1962 to 1994 
Number of observations: 33 
Mean of dep. var. = .032166 
Std. dev. of dep. var. = .016776 
Sum of squared residuals = .269899F-02 
Variance of residuals = .899663F-04 
Std. error of regression = .948506E-02 
R-squared = .700307 
Adjusted R-squared = .680327 
LM het. test = .401618 [.526] 


Durbin-Watson = 1.98694 [.334,.638] 
Breusch/Godfrey LM : AR/MAI = .135113E-02 [.971] 
Breusch/Godfrey LM : AR/MA2 = .064560 [.968] 

Ljung-Box Q-statisticl = .121645E-02 [.972] 
Ljung-Box Q-statistic2 = .089390 [.956] 
Wald nonlin. ARI vs. lags = 1.36760 [.505] 
ARCH test = .421448 [.516] 
CuSum test = .423037 [.853] 
CuSumSq test = .086548 [1.00] 
Chow test = .513721 [.676] 

LR het. test (w/ Chow) = -1.40845 [1.001] 


White het. test = 5.31376 [.379] 
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Jarque-Bera test = .515258 [.773] 

Shapiro-Wilk test = .965642 T.370] 
Ramsey’s RESET2 = 4,49155 * [.043] 
F (zero slopes) = 35.0512 ** [.000] 
Schwarz B.I.C. = -103.218 

Akaike Information Crit. = -105.463 

Log likelihood = 108.463 
Estimated Standard 


Variable Coefficient Error t-statistic P-value 
( .019425 .652456E-02 2.97724 *x [.006] 
DLY .671/728 .110019 6.10557 *x [.0001] 
DLP -.849897 .101655 -8.36062 *x [000] 


Les coefficients estimés par la méthode des variables instrumentales sont présentés dans 
la colonne estimated coefficient du tableau de résultats ayant comme titre equation 1. Les 
coefficients estimés par la méthode des MCO sont présentés dans la colonne estimated 
coefficient du tableau de résultats ayant comme titre equation 2. Les coefficients estimés 
par VI et par MCO sont différents (même si cette différence est d’une ampleur modérée), 
ce qui suggère un éventuel problème de simultanéité. 


EXERCICE 8 CONSOMMATION PAR LA MÉTHODE DU MAXIMUM 


DE VRAISEMBLANCE 


Énoncé 


Utilisez de nouveau les données du fichier USA.xls, téléchargeable à partir du site Internet 
afférent à ce livre. Estimez le modèle linéaire expliquant la variation logarithmique de la 
consommation en fonction des variations logarithmiques des revenus et des prix, mais 
cette fois en utilisant la méthode du maximum de vraisemblance. Supposez que le terme 
d’erreur est indépendant des variables de droite, qu'il s’agit d’un bruit blanc et qu’il est 
normal. 


Le modèle à estimer est DLC, = fi + B2DLY, + B3DLP, + w, où u:N(0, 0°). Les u, sont 
supposés être des bruits blancs et indépendants des DLC, et DLY;. Le logarithme de la 
fonction de vraisemblance est donc égal à : 


Lee (r — Bi — B2DLY; — B:DLP,) 


nL (B, oi) _ : n27r 302 


t=1 


Il faut écrire un programme d’instructions TSP qui trouve les valeurs des coefficients qui 
maximisent cette fonction. Bien entendu, les valeurs qui maximisent In(L(B, ?)) sont les 
mêmes que celles qui maximisent sa transformation monotone croissante suivante : 


be DL 2B-DLP) 
21nL (8,0%) + nln2x = n in 0? — Pre PRE SRE 


t=1 


2 
O4 
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Le programme d’instructions TSP est Le suivant : 


FREQ À; 

SMPL 60 94; 

READ(FILE=’c :\USA.XLS’); 
LC=LOG(CT) ; 

LY=LOG(Y); 

LP=LOG(P) ; 

SMPL 61 94; 

DLC=LC-LC(C-1); 

DLY=LY-LY(-1); 

DLP=LP-LP(-1); 

FRML EQT LOGL=LOG(CSIGINV)+LNORM((DLC--XB)*SIGINV); 
FRML EQXBI XB=B1+B2*DLY+B3*DLP; 

EQSUBC(NAME=OLS) EQ1 EQXB1l: 

PARAM BI B2 B3 SIGINV; 

SET SIGINV=1; 
LCHITER=N,HCOV=NBW) OLS; 


Les coefficients à estimer sont B1, B2 et B3 qui représentent B1, B2 et B3. Il faut également 
estimer 6,. Cela revient à estimer o:,!, représenté ici par SIGINV. LOGL représente la 
partie du logarithme de la fonction de vraisemblance qui correspond à une observation. 
La fonction LNORM(x) représente le logarithme de la fonction de densité d’une N(0, 1) 
évaluée en x. Vous obtenez les résultats suivants : 


MAXIMUM LIKELIHOOD ESTIMATION 


ÉQUATION: OLS 
Working space used: 645 
STARTING VALUES 
B1 B2 B3 SIGINV 
VALUE 0.00000 0.00000 0.00000 1.00000 
F= 31.266 FNEW= 7.9344 SQZ= O0 STEP= 1.0000 CRIT= 34.236 
F= 7.9344 FNEW= -10.607 SQZ= O0 STEP= 1.0000 CRIT= 38.14 
F= -10.607 FNEW= -11.461 SQZ= 3 STEP= 0.12500 CRIT= 378.75 
F= -11.461 FNEW= -48.508 SQZ= 1 STEP= 0.50000 CRIT= 117.74 
= -48,508 FNEW= -64.420 SQZ= 1 STEP= 0.50000 CRIT=. 52,250 
F= -64,420 FNEW= -80.388 SQZ= 2 STEP= 0.25000 CRIT= 87.52 
F= -80.388 FNEW= -90.705 SQZ= O0 STEP= 1.0000 CRIT= 34.624 
F= -90.705 FNEW= -105.48 SQZ= 2 STEP= 0.25000 CRIT= 126.22 
F= -105.48 FNEW= -110.49 SQZ= 1 STEP= 0.50000 CRIT= 19.698 
F= -110.49 FNEW= -110.74 SQZ= O0 STEP= 1.0000 CRIT= 0.650034 
F= -110.74 FNEW= -110.75 SQZ= O0 STEP= 1.0000 CRIT= 0.22757E-02 
F=+ SLTO:75 FNEW= -110.75 SQZ= O0 STEP= 1.0000 CRIT= 0.80716F-07 
CONVERGENCE ACHIEVED AFTER 12 ITERATIONS 
34 FUNCTION EVALUATIONS. 
umber of observations = 34 Log likeliïhood = 110.746 
Schwarz B.I.C. = -103.693 
Standard 
Parameter Estimate Error t-statistic P-value 
B1 .016282 .613489E-02 2.65396 [.008] 
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B2 .696019 .107093 6.49918 [.000] 
B3 -.832804 .099321 -8.38500 [.000] 
SIGINV 107.359 13.0191 8.24621 [.000] 
Standard Errors computed from analytic second derivatives 
(Newton) 
Standard 
Parameter Estimate Error t-statistic P-value 
BI .016282 .620506E-02 2.62395 [.009] 
B2 .696019 .110242 6.31354 [.000] 
B3 -.832804 .123473 -6./4481I [.000] 
SIGINV 107.359 16.6155 6.46136 [.000] 
Standard Errors computed from covariance of analytic first derivatives 
(BHHH) 
Standard 
Parameter Estimate Error t-statistic P-value 
BI .016282 .641869E-02 2.53662 [.011] 
B2 .696019 .108838 6.39501 [.000] 
B3 -.832804 .082664 -10.0746 [.000] 
SIGINV 107.359 11.1076 9.66537 [.000] 
Standard Errors computed from analytic first and second derivatives 


(Eicker-White) 


MODÉLISATION DE LA POLITIQUE MONÉTAIRE 


Énoncé 


Estimez un modèle expliquant le niveau des taux d’intérêts américains en fonction du 
taux d’inflation et du taux de chômage. Pour que les écarts types estimés des coefficients 
estimés soient corrects, même en présence d’hétéroscédasticité, utilisez une estimation 
robuste de la matrice de variance et de covariance des coefficients estimés. Comparez avec 
les écarts types obtenus par l'estimation habituelle de cette matrice. 


Le fichier USA xls téléchargeable sur le site www.pearsoneducation.fr rassemble plusieurs 
variables, de 1960 à 1994, dont : 

R: letaux d'intérêt; 

UR : le taux de chômage; 

P: l'indice des prix à la consommation. 

Travaillez avec TSP. 


Vous allez estimer un modèle linéaire dont la variable dépendante est le taux d’intérêt R;, 
et les variables explicatives sont l'inflation INF,, le taux de chômage UR; et le taux d’intérêt 
retardé R;-_,. Le taux d'inflation INF, doit être généré à partir de l'indice des prix P, à 
l’aide de la formule INF, = 100(P; — P;_1)/P;_1. Le programme permettant d’estimer 
cette relation par moindres carrés ordinaires est présenté ci-après. Le modèle est estimé 
successivement sans et avec une matrice de variance et de covariance robuste. 

freq à; 

smpl 1960 1994; 

read(file=’c :\usa.x1s”); 

smpl 1961 1994; 

inf=100*(p-p(-1))/p(-1); 

regopt(pvprint,stars) all; 


Compléments sur les modèles linéaires 


Ssupres vcov vcor cSsmax Ccsqmax chow: 


noplot; 


olsg r c inf ur r(-1l); 
olsqg(robustse, hctype=1) r c inf ur r(-1); 


Ch 


L'option robustse commande une estimation robuste des écarts types. L'option hctype= 
permet de choisir entre différentes formules. Ici, vous utilisez une formule dont les degrés 
de liberté sont ajustés pour un petit échantillon. L’instruction supres et ses arguments 
suppriment certains résultats, dont l'impression des tests de constance des coefficients, 
qui sont inutiles. 


Dependent va 


riable: R 


Equation 1 


Method of estimation = Ordinary Least Squares 


Current sample: 1961 to 1994 


Number of observations: 
Mean of dep. var. 


Std. dev. 


of dep. 


R-squ 


var. 


Sum of squared residuals 
Variance of residuals 
Std. error of regression 


ared 


Adjusted R-squared 


Du 


LM het. 
Durbin-Wa 
Durbin 
rbin’sh 
ARCH 


test 
tson 
’s h 
alt. 
test 


LR het. test (w/ Chow) 


Whi 


Jar 


Shapi 


Ra 


te het. 
que-Bera 
ro-Wilk 


test 
test 
test 


sey’s RESET2 


F (zero slopes) 
Schwarz B.I.C. 


Akaike Infor 


nation Cr 


VTs 


Log likelihood 


Estimated 
Variable Coefficient 
C .916789 
INF .279208 
UR -.159064 
R(-1) .846701 


34 


= /7.64232 
= 2.61989 
= 23.2655 
= ./75517 
= .880634 
= .897285 
= .887014 
= 4.813/8 * [.028] 

= 1.97024 [.247,.694] 
= -.298590 [C.765] 

= -.291388 [.771] 

= .644711E-02 [.936] 
= 18.7/015 ** [.000] 

= 12.1299 [.206] 

= 4.35856 [.113] 

= .936582 * [.049] 

= 2.89648 T.099] 
=:87.,3571. *# [0001 


= 48.8470 
= 45,7943 
= -41.7943 
Standard 

Error t-statistic P-value 
.655369 1.39889 [.172] 
.069364 4.02527 *x [000] 
.151533 -1.04969 [.302] 
.091481 9.25547 *x [000] 
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Equation 2 
Method of estimation = Ordinary Least Squares 
Estimated Standard 

Variable Coefficient Error t-statistic P-value 
C .916789 .384744 2.38286 * [.0241 
INF .279208 .082467 3.38568 *x [.002] 
UR -.159064 .083728 -1.89976 [.067] 
R(-1) .846701 .098165 8.62526 *x [.0001] 
Standard Errors are heteroskedastic-consistent (HCTYPE=1). 


Très logiquement, le coefficient de INF est positif tandis que celui de UR est négatif. 
Plusieurs tests d’hétéroscédasticité ont des probabilités critiques inférieures à 0,05, ce 
qui suggère une hétéroscédasticité du terme d’erreur. Cela implique que les écarts types 
estimés de manière conventionnelle, présentés sous le titre equation 1, ne sont pas fiables. 
Par contre, les écarts types estimés de manière robuste, présentés sous le titre equation 2, 
sont fiables. Par ailleurs, la précision de l’estimation du coefficient du taux de chômage 
semble bien meilleure quand les écarts types sont estimés de manière robuste. 


Compléments sur les modèles linéaires 


Chäpitre 

+ e e e D 
Références bibliographiques 
[ANG 1996] P. Anglin, R Gencay, Semiparametric Estimation of a Hedonic Price Function, 
Journal of Applied Econometrics, 11 (6), p. 633-648, 1996. 
[BRE 1981] T.S. Breusch, L.G. Godfrey, À Review of Recent Work on Testing for Auto- 
correlation in Dynamic Simultaneous Models, dans Macroeconomic Analysis : Essays in 
Macroeconomics and Econometrics, eds D. Currie, R. Nobay and D. Peel, Croom Helm, 
London, 1981. 
[BRE 1980] T.S. Breusch, A.R. Pagan, The Lagrange Multiplier Test and its Application to 
Model Specifications in Econometrics, Review of Economic Studies, 47, p. 239-253, 1980. 
[CHR 1984] L. Christensen, W. Greene, Economies of Scale in US Electric Power Gene- 
ration, Journal of Political Economy, 84 (4), p. 655-676, 1984. 
[DAV 1993] R. Davidson, J.G. MacKinnon, Estimation and Inference in Econometrics, 
Oxford University Press, New York, 1993. 
[GRE 2000] WH. Greene, Econometric Analysis, Fourth Edition, Prentice Hall Interna- 
tional, New Jersey, 2000. 
[MAC 1985] J.G. MacKinnon, H. White, Some Heteroskedasticity-Consistent Matrix 
Estimators with Improved Finite Sample Properties, Journal of Econometrics, 29, p. 305- 
325, 1985. 
[NEW 1987] W.K. Newey, K.D. West, À Simple, Positive Semi-Definite, Heteroskedasticity 
and Autocorrelation Consistent Covariance Matrix, Econometrica, 55, p. 703-708, 1987. 
[PES 1999] M.H. Pesaran, L.W. Taylor, Diagnostics for IV Regressions, Oxford Bulletin of 
Economics and Statistics, 61, p. 255-281, 1999. 
[PES 1994] M.H. Pesaran, R.J. Smith, À Generalized R Criterion for Regression Models 
Estimated by the Instrumental Variables Method, Econometrica, 62, p. 705-710, 1994. 
[SPA 1986] A. Spanos, Statistical Foundations of Econometric Modelling, Cambridge Uni- 
versity Press, Cambridge, 1986. 


[WHI 1980] H. White, A Heteroskedasticity-Consistent Covariance Matrix Estimator and 
a Direct Test for Heteroskedasticity, Econometrica, 48, p. 817-838, 1980. 


Références bibliographiques 125 


le 


Équations 


Chapitre 


= | 


Ï ti Ï 
© 
t ti i 
een REA Ce chapitre traite des modèles économétriques à 
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Régressions simultanées plusieurs équations. Il s'intéresse d’abord aux 
” pi ds Fe régressions simultanées et à la méthode SUR, puis 
. Systèmes d'équations simultanées | | .. 
et identification 129 aborde les modèles à équations simultanées, définit les 
ne des doubles moindres 131 notions importantes de forme structurelle et de forme 
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CONTES 134 d st Il 
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et méthode 3MC 140 information complète. 
. Modèle macroéconomique 
et méthode MV ...................... 143 
+ e e | + 
El Régressions simultanées 
+ 
et méthode SUR 
L'objectif de cette section est d’étudier l'estimation d’un modèle à 
plusieurs équations, ayant chacune des variables explicatives dif- 
férentes, et dont les termes d’erreur contemporains sont corrélés 
entre eux, mais indépendants des variables explicatives. Un tel 
modèle est composé de m équations de type : 
Yi = Xi; + ui; (4.1) 
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Ya Ba Uii 1 Xi Kiki 

| Ya Ba ui 1 Xp +. Xp 
où = Bi) ul  [JetX=|. ; pour tout 

Vin Bx; Uin 1 Xjn Se Xitin 


i=1...m. 


Les termes d’erreur contemporains des différentes équations sont corrélés entre eux : 
Cov(ui, js) = 6 pour tout i = 1...metj = 1...m. En revanche, pris à des périodes 
différentes, ils ne sont pas corrélés entre eux : Cov(ui, uÿ_e) = 0 pour tout i = 1...m, 
j=1...metpourtout8 > 1. 


Le terme d’erreur de chaque équation est supposé homoscédastique et non autocorrélé : 
Cov(u;, uir-0) = 0 et V(uis) = 0? pour touti = 1...m. Ces hypothèses impliquent que : 


Gen 0 4m 0 

, 0ÿ -.. 0 
Eu; + E(uiu;) — 5 ; ’ : — Oijln 
D" 0 0 
et 
2 0 0 
2 0 
i 
2; = E(uju}) = = 0;lh (4.2) 


1 


Ces équations sont appelées « équations SUR » (Seemingly Unrelated Regression) par 
Zellner [ZEL 1962]. La méthode SUR permet d'obtenir des estimations plus précises des 
coefficients que celles obtenues en appliquant simplement les MCO à chaque équation. 
En « raccordant bout à bout » les vecteurs Ÿ; des m équations, on obtient une variable 
dépendante composite ayant m x n lignes et 1 colonne : 


Y — | = is Mini oo ons Va ons Va) 


Le système d’équations initial peut s’écrire sous la forme d’une seule équation linéaire : 


Y =XB+u (4.3) 
X1 0 0 Bi ui 
0 X 0 B2 u2 
où X — £ ) B — etu — 
OR SES By Um 


La matrice X a m x nlignes et k; +k, +:-.+k,, colonnes. Le vecteur Ba k1+k+...+k,, 
lignes et 1 colonne. Le vecteur # a m x n lignes et 1 colonne. La matrice de variance et 
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: | 
covariance du terme d’erreur u est : 


Oÿ O12 ‘‘‘ Oïm 
, O1 03 ‘:: Om 

Zu = E(uu;) = . | | ; Ql;, = 2@l;, (4.4) 
Omi Om ‘‘: CE 


Dans l’équation (4.4), on utilise le produit de Kronecker (ou produit tensoriel). Si les 
valeurs des 6? et 6; sont connues, il est logique d’estimer ce modèle par la méthode 
des moindres carrés généralisés, dite MCG (voir chapitre 3). Toutefois, elles ne sont pas 
connues dans la réalité. Zellner [ZEL 1962] propose d’estimer d’abord chaque équation 
séparément par MCO : 

Y; — Re + 6; (4.5) 


et d’utiliser les résidus de ces équations pour obtenir des estimations des 6? et o; : 


Re (4.6) 
D pee  Jn-k/n-f; | 
d J 


Ces estimations forment une matrice à estimée, utilisable dans la formule des MCG. On 
obtient ainsi les estimateurs SUR des coefficients : 


pre ( (£” 8) x) x (£” ® 1) Y (4.7) 


On montre que ces estimateurs sont plus précis (variance plus faible) que ceux que l’on 
obtient en estimant chaque équation indépendamment par MCO. L'explication est simple: 
la méthode SUR tient compte des corrélations contemporaines entre les termes d’erreur 
des différentes équations. Toutefois, si les covariances contemporaines sont toutes nulles, 


ou si les variables explicatives sont les mêmes dans les m équations (X1 = X2 =: =X,), 
les estimateurs SUR et les estimateurs de MCO de chaque équation prise indépendamment 
sont égaux. 


PA Systèmes d'équations simultanées 
et identification 


Pour comprendre ce qu'est un modèle à équations simultanées, il faut distinguer les 
variables endogènes des variables exogènes. Les premières sont telles que leur valeur en t 
est déterminée par le modèle alors que les secondes ne sont pas déterminées par le modèle : 
elles sont données telles quelles et, conditionnellement à leur valeur, le modèle détermine 
les valeurs des variables endogènes. Les variables exogènes et endogènes retardées sont 
dites prédéterminées. 

Un modèle à équations simultanées décrit la manière dont se déterminent simultanément 
les valeurs de G variables endogènes à la période f, en fonction des valeurs contemporaines 
ou retardées de certaines variables exogènes, et d'éventuelles valeurs retardées des variables 
endogènes. Certaines variables endogènes sont fonction d’autres variables endogènes et 
cette simultanéité produit des équations apparemment linéaires, où le terme d’erreur est 
lié aux variables explicatives. 
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Un modèle à équations simultanées est décrit par G équations structurelles de la façon 
suivante : 


Bin Vas + Ba Vas + + + Bi Yo + YaXu + YoXn +: + Yi XR = ui (4.8) 


pour tout i = 1...G, et pour tout { = 1...n, où les Y; sont les G variables endogènes 
et les X} sont les K variables prédéterminées. Souvent, dans les équations, le coefficient 
de l’un des Y; est normalisé à 1 (par exemple B;; = 1 pour tout i = 1...G) et la variable 
explicative X;, vaut 1, pour tout f, de sorte qu’elles peuvent s’écrire : 


Yi = —Yà + Si Bin) Ye + (Ya) Ka + + + (—yir) Xi + Wir (4.9) 
I£i 
Dans la suite du chapitre, on utilisera la formulation précédente. 


Des identités qui relient certaines variables du modèle, sans faire intervenir des coefficients 
inconnus et sans terme d’erreur, remplacent parfois certaines équations structurelles. Si 
on a G; équations structurelles et G> identités, G = Gi + G. Il faut G équations ou 
identités pour pouvoir déterminer G variables endogènes. 


Une équation structurelle ne fait pas nécessairement intervenir toutes les variables : parmi 
les endogènes et les prédéterminées, certaines peuvent être absentes (leurs coefficients 
peuvent être nuls). Des restrictions a priori peuvent en outre relier certains coefficients. 
Généralement, on pose la condition que la première variable prédéterminée x, est exogène 
et vaut 1 à toute période f, de manière à avoir une constante dans les équations. Le système 
formé par les équations structurelles et les identités s'appelle forme structurelle et peut 
s'exprimer de manière matricielle : 


By: + x; = U; (4.10) 
Vis Xi Uis 
V2 ZX U2s 
pour tout f = 1l...n, où y; = … Lx = . ww = . |, B = 
YGr Xk: UGt 
Bin Paz *:+ Bic Vis V2 5  VIK 
Bai Bas -:: Bic Var V22 se V2x ; 
| F ; et T — | A 2 | . La matrice B a G colonnes 
Ba Ba ‘:: cc YGi YG ‘‘' YGK 


et G lignes. La matrice la G lignes et K colonnes. Si l’équation i est une identité, ;; = 0 
et les coefficients B;; et y;; ont des valeurs connues dès le départ. Si toutes les équations 
ou identités sont normalisées, B;; = 1 pour tout i. Si une constante figure dans certaines 
équations, X1, = 1 pour tout f. 


La théorie économique, financière, ou marketing, suggère des restrictions a priori sur les 
paramètres de B et T°. Sans ces restrictions, les G équations seraient similaires et il serait 
impossible d’estimer leurs coefficients. Quand on fixe les valeurs des éléments de B et G, la 
forme structurelle est un système de G équations permettant de déterminer les valeurs des 
G variables endogènes Y; en fonction des K variables prédéterminées X;;,. Si la matrice B 
n’est pas singulière, la solution du système s'appelle forme réduite et s’exprime de la façon 
suivante : 

= —B Tx, + Blu = Ilx, + (4.11) 


où II — Es S E et v; = Blu. 
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Si l’on multiplie le système By, +Tx; = u, par une matrice F non singulière à G lignes et G 


colonnes, on obtient un nouveau système équivalent : FBy,+FTx, = Fu,.Siles hypothèses 
sur la distribution des u;, restent inchangées, on montre que le nouveau système et l’ancien 
ont exactement la même fonction de vraisemblance. Il manque donc des informations 
dans les données pour déterminer si les coefficients « vrais inconnus » valent B et F, ou 
bien FB et FT. Les deux formes structurelles sont équivalentes en observation. On montre 
qu’elles ont exactement la même forme réduite. Sans restrictions, les coefficients de B et 
F ne sont donc pas identifiés : plusieurs valeurs de B et F impliquent les mêmes valeurs 
des coefficients T1 de la forme réduite. Si l’on connaît les valeurs des coefficients de II, 
on ne peut donc pas trouver de manière unique les coefficients de B et T°. Pour identifier 
certains paramètres de B et |”, il faut imposer des restrictions valables à la fois sur les 
coefficients des matrices B et l' et sur les coefficients des matrices FB et FT résultant de 
toute transformation de la forme structurelle. 


Les coefficients d’une équation structurelle sont identifiés quand seules des valeurs 
uniques, compatibles avec des valeurs fixées des coefficients de la forme réduite, sont en jeu. 
Par conséquent, les restrictions posées a priori sur B et l, et qui doivent être conservées par 
des transformations EB et FT, doivent impliquer suffisamment de restrictions sur toute 
matrice de transformations F pour que les coefficients contenus dans FB et FT soient 
identiques à ceux contenus dans B et F. 


Le lien entre les coefficients de la forme structurelle et les coefficients de la forme réduite 


IT 
est bien résumé par la relation AW = 0 où À = [B l] et W = ile La matrice À a G 
K 


lignes et (G+K) colonnes. La matrice W a (G+K) lignes et G colonnes. Chaque ligne de A 
est notée a;, pour i = 1... G. Une telle ligne est une matrice à 1 ligne et (G+ K) colonnes. 
Évidemment, a;W — 0 pour tout i = 1...G.Imposer r; restrictions aux coefficients de a; 
implique qu’il existe une matrice ;, avec (G + K) lignes et r; colonnes, telle que @;; = 0. 
La ligne a; doit donc respecter la condition générale a;[W ®;] = 0. La matrice [W ;] 
a (G + K) lignes et (G + r;) colonnes. Si, en plus, on normalise à; en posant qu'un de 
ses coefficients est égal à 1, il faut, pour que l'équation a] W 6;] = 0 ait une solution a; 
unique, que le rang de [W i] soit égal à G + K — 1, ce qui est réalisé si et seulement si 
le rang de Av; est égal à G — 1. Il faut pour cela que r; soit supérieur ou égal à G — 1. 
En d’autres termes, on peut identifier les coefficients d’une équation structurelle si Le 
nombre de restrictions a priori sur lesdits coefficients est au moins égal à G — 1, où G est 
le nombre d'équations et identités du système (ou de variables endogènes). Quand seules 
des restrictions d’exclusion portant sur les variables de léquation sont posées, il faut, 
pour opérer cette identification, que le nombre r; de variables exclues soit au moins égal 
à G — 1, c’est-à-dire que le nombre de variables prédéterminées exclues soit au moins 
égal à celui des variables endogènes présentes dans l’équation moins une. 


Une équation est « exactement identifiée » quand le nombre de restrictions est égal au 
minimum requis pour l'identification ; quand il est supérieur à ce minimum, on dit qu’elle 
est « suridentifiée ». 


EF Méthode des doubles moindres carrés 


Abstraction faite d'éventuelles identités, chaque équation structurelle se présente encore 
de la manière suivante : | 
Y; = Y'B; + Xiy; + u; (4.12) 
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pour tout i = 1...G1. En l’absence d’identités, G;, = G. La notation Ÿ; représente le 
vecteur des # observations de la # variable endogène. Les vecteurs d'observation des g; 
autres variables endogènes présentes dans l'équation i forment les colonnes de la matrice 
Yi, à n lignes et g; colonnes. Les vecteurs d'observation des k; variables prédéterminées 
forment la matrice X;, à n lignes et k; colonnes. Bien entendu, g; < G— 1 et k; < K. Le 
vecteur colonne f; est composé des valeurs non nulles —B;; (j = 1...Get j  i), où les 
Bi sont les éléments non nuls de la ligne j de la matrice B (dans laquelle les B;; valent 1). 
Le vecteur colonne y; est formé des valeurs non nulles —y;; (j = 1...K), où les y; sont 
les éléments non nuls de la ligne j de la matrice M. Chaque équation j se représente encore 
de la manière suivante : 


= PDP | tue Zi tu (4.13) 
Yi 
où Z; = (Y'X;) est une matrice à n lignes et (g; + k;) colonnes, et où Bi = À;. 
Yi 


Le choix d’une méthode d’estimation d’un modèle structurel dépend évidemment des 
hypothèses faites sur la distribution du terme d’erreur. Généralement, on suppose que 
les termes d’erreur contemporains des différentes équations sont corrélés entre eux : 
CoV(uis, ujr) = 6j pour tout i = 1...m et j = 1...m, et que les termes d’erreur non 
contemporains (de périodes différentes) ne sont pas corrélés entre eux: Cov(u;;, uj_o) = 0 
pour tout i = 1...metj = 1...met pour tout 0 > 1. Le terme d’erreur de chaque équa- 
tion est supposé homoscédastique et non autocorrélé : Cov(u:r, uir-9) = 0 et Vu) = 0? 
pour tout i = 1...m. Ces hypothèses impliquent que : 


Oi (0) 

: 0 Ci NT 

Zuiu; = E(uiu) = : . . è = Oijln 
0 0 0j 
et 

0? 0 0 

! 0 . 0 2 

2, = E(uju!) — | A (4.14) 

0 O0 0? 


On peut néanmoins choisir d’ignorer les liens entre les termes d’erreur des différentes 
équations, et estimer chacune d’entre elles individuellement. Ce faisant, on produit des 
estimateurs moins précis que ceux obtenus lorsque l’on tient compte de la corrélation 
contemporaine entre les termes d’erreur des différentes équations. Toutefois, de tels 
estimateurs peuvent être au moins non biaisés ou convergents, à condition que l’on tienne 
compte de la simultanéité. Effectivement, la présence de variables endogènes comme 
variables explicatives d’autres variables endogènes implique que le terme d’erreur de 
chaque équation n’est généralement pas indépendant de toutes les variables explicatives 
de cette équation (voir chapitre 2). Par conséquent, estimation de chaque équation par la 
méthode des MCO est exclue : on obtiendrait des estimateurs biaisés et non convergents. 
Il faut donc recourir à une méthode de variables instrumentales. 
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Chapitre 


La méthode des doubles moindres carrés, dite 2MC, notée 2SLS en anglais (2 Stages Least 


Squares), est l’estimation séparée de chaque équation du système par la méthode des 
variables instrumentales, qui sont en l’occurrence toutes les variables prédéterminées du 
système (au-delà de l’équation ;) qui forment la matrice X7 telle que : 


Xu ZX ::: Xr 

X12 X22 ::: XR 
XT = . ; ; 

Xin Xon 54 XKn 


L'estimateur des doubles moindres carrés de \; est donc: 
RMC ZE (ZX (X EXT) 'XEZ:) ZiXr(X EXT) XF Y: (4.15) 


On peut aussi obtenir cet estimateur en deux étapes : 

1) On estime une régression de chaque variable Y; de Y'( j = 1...g;) sur toutes les 
variables prédéterminées du système, par la méthode des moindres carrés ordinaires : 
Y; = XrP "04e; avec po = (XEXr) (Xr)' Yi, et l’on garde les valeurs calculées 
ainsi obtenues : de = XD," = Xr (XEXr) (Xr)' Y. On les rassemble dans une 


ni ni 


matrice Ÿ — (e ... = Xr CE) (Xr) Y'. On définit alors la matrice 
2e(fx) 

2) On estime une régression de Y; sur les variables . et sur les variables de X; par MCO.II 
s’agit donc d’une régression de Y sur les variables de 2; — ( x) :Y;= ZRMCLE, 
où 


es ESS = A! 
RMC (22:) ae (4.16) 


On peut encore présenter l’estimateur des doubles moindres carrés en agrégeant les 
différentes équations de la manière suivante : 


Y=Z\+u (4.17) 
a Z 0 0 NAME ui 
eh lat eee eee 
Ya 0 0 2: x2MC uG, 


2 
OT  O12 ‘‘' Oim 
2 
; O21 O3 ‘'' O2m 
Z,=Eun)=| . ES _ [@&r,=E@1, 
2 
Oml  Om2 y 
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Après projection des variables endogènes de droite sur les variables instrumentales (toutes 
les variables endogènes du modèle), on peut définir le modèle agrégé estimé suivant : 


Y=Z\MCHE (4.18) 
Pa Qyéte D ue E 
. Dre ; F2MC E 
GùZ= | Si | HN à etE= {| . |,etoù 
0 0 ... Za ee EG 
À TN EL. SR k =l,x 
f2MC = (22) PE (27) 2Y (4.19) 


22MC à | po , : 
B etl "EC sont donc les estimateurs de B et l. Une estimation de la matrice de variance 


et de covariance de x2"C est donnée par : 
1 


On montre que les estimateurs des doubles moindres carrés sont convergents. Toutefois, 
ils présentent un biais de petit échantillon ; ils sont asymptotiquement normaux. Comme 
ils ne tiennent pas compte des corrélations entre les termes d’erreur (ou des perturbations) 
des différentes équations, ils sont en général asymptotiquement inefficients, au sens où 
leur précision est moindre que celle des estimateurs que l’on obtient en tenant compte 
de ces corrélations. En contrepartie de cette insuffisance, ils présentent l’avantage ne pas 
être affectés par d'éventuelles erreurs de spécification dans les différentes autres équations 
puisqu'ils n’en tiennent pas compte. 


E1 Méthode des triples moindres carrés 


La méthode des triples moindres carrés, dite 3MC, notée en anglais 3SLS (3 Stages 
Least Squares), est à information complète. L’estimateur des triples moindres carrés 
est l’estimateur 2MC avec une correction du type des moindres carrés généralisés, qui 
tient compte des corrélations contemporaines entre les termes d’erreur des équations 
structurelles du modèle. 


Il s’agit donc d’une nouvelle manière d’estimer les G; équations (4.12), qui peuvent être 
agrégées en la formule (4.17), et dont les termes d’erreur contemporains sont corrélés, 
comme indiqué par la matrice Z. On réalise les étapes 1 et 2 de la méthode des doubles 
moindres carrés, puis on utilise les résidus E; ainsi obtenus pour estimer les éléments de 
la matrice X : 


BE À EE, 


EE 0 (4.20) 


n— k; n — ki 


Ces estimations forment une matrice Ÿ estimée, qui peut être utilisée dans la formule des 
MCG. On obtient ainsi les estimateurs 3MC des coefficients : 


A A/ A À —1 A/ A 
$sMC (Z (£ @1) 2) 2 (£” 1) Y (4.21) 
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Chapiite 


A3MC D | 


B et [MC sont donc les estimateurs de B et I. Lorsque toutes les équations sont 
exactement identifiées, les estimateurs des triples moindres carrés sont identiques aux 
estimateurs des doubles moindres carrés : X?MC — \2MC, 


Une estimation de la matrice de variance et de covariance de MC est donnée par : 
À " R Nil 
Ÿssuc = (Z (£” @ 1) 2) (4.22) 


On constate que les estimateurs des triples moindres carrés sont convergents. Toute- 
fois, ils présentent un biais de petit échantillon ; ils sont asymptotiquement normaux. 
Lorsque certaines équations du modèle sont suridentifiées, ils sont plus efficients que les 
estimateurs 2MC. 


E Méthode du maximum de vraisemblance 


La méthode du maximum de vraisemblance, notée FIML (Full Information Maximum 
Likelihood), est à information complète. Contrairement aux méthodes 2MC et 3MC, elle 
nécessite de faire des hypothèses explicites sur la distribution. En général, on suppose que 
le modèle structurel By, + Lx, = u, est tel que 4, — N(0, »). 

Pour G; = G, cette distribution normale du terme d’erreur implique que la fonction de 
densité de y,, conditionnellement à x;,, est donnée par : 


ù = ! es 
G@m) À Idet BI (det 37) * e 1) Entre) (4.23) 


L'hypothèse d'indépendance intertemporelle implique alors que le logarithme de la fonc- 
tion de vraisemblance est : 


In(Z (B,T, 2)) = _ In (2x) + nn (|det B|) 


n —1 


= sin (det > — : D» (By: + Lx)" > (By: + lx;) (4.24) 


t=1 


Les estimateurs de maximum de vraisemblance BMV, FMV et ZMŸ sont les valeurs de B, 
F et Z pour lesquelles cette fonction est maximale. Ils sont convergents et asympto- 
tiquement efficients, à condition que le choix de la distribution soit correct. Ils sont 
asymptotiquement distribués selon une normale. 
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Résumé 


Les systèmes de régressions simultanées regroupent des équations qui 
expliquent chacune une variable endogène, en fonction de variables expli- 
catives différentes, qui ne comportent aucune variable endogène. Les pertur- 
bations ou termes d’erreur sont indépendants des variables explicatives. Les 
équations sont liées pour la simple raison que les termes d’erreur contempo- 
rains sont corrélés entre eux. La méthode SUR permet d'obtenir des estimateurs 
plus précis que ceux que l’on a en appliquant les MCO à chaque équation. Les 
modèles à équations simultanées regroupent des équations qui expliquent 
chacune une variable endogène en fonction de variables prédéterminées et 
souvent aussi d’autres variables endogènes, qui sont elles-mêmes expliquées 
par d’autres équations du modèle. Cette simultanéité implique que les termes 
d’erreur sont liés aux variables explicatives. On ne peut estimer les coeffi- 
cients que sous certaines conditions d’identification. La méthode des doubles 
moindres carrés, qui est à information limitée, et celles des triples moindres 
carrés et du maximum de vraisemblance, qui sont à information complète, 
sont des outils d'estimation appropriés. 
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Problèmes 
et exercices 


EXERCICE | 


Énoncé 


MODÈLE MACROÉCONOMIQUE 
ET MÉTHODE 2MC 


Le fichier FR.xls, téléchargeable sur le site Internet afférent à cet ouvrage, contient les 
variables suivantes, sur une période allant de 1978 à 2002 : 


CE : 
JÉE 


. 


PM : 


consommation des ménages à prix constants ; 

investissement ou formation brute de capital fixe à prix constants ; 
exportations à prix constants ; 

importations à prix constants ; 

produit intérieur brut à prix constants ; 

revenu primaire réel des autres secteurs que les ménages ; 


prélèvements d’impôts et cotisations sociales sur les ménages en termes réels, 
nets de prestations reçues par les ménages ; 


indice des prix de la consommation ; 
indice des prix des importations. 


Sur la base de ces données, on peut définir les variables suivantes : 


INF: 


revenu disponible réel des ménages, égal à RPR — PRELN; 

autres composantes de la demande domestique à prix constants, égales à PIB — 
(CF+I1+X—M); 

revenu primaire réel des ménages, égal à PIB — RPA; 

prix relatif des importations, égal à PM/P; 

taux d’inflation égal à la variation logarithmique de P. 


On spécifie un modèle macroéconomique dont les équations structurelles sont les sui- 


vantes : 


CE, —= (021 ATX œRDR; + a3RDR;-; + O4CF;-_1 + OSINF, + Uir 
I = Bi Ar B2PIB, Que B3PIB;-1 aa Balr-1 + Ur 
M, = y: + YP1B, + y3PMR; + yaMi_: + us 


Les identités sont : 


PIB; = CF, +1, + RES; + X; — M; 
RPR, = PIB, — RPA, 
RDR; = RPR; — PRELN; 
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Les variables endogènes sont CF;, RDR,, I,PIB,, M, et RPR.. Les variables exogènes sont 
INF, et PMR,. Les variables prédéterminées sont CF,_;, RDR;_:, 1;_1, PIB;_1, INF,, PMR, 
et M,_1. Estimez ce modèle par la méthode des doubles moindres carrés. Travaillez 
avec TSP. 


Il faut d’abord vérifier que les conditions d’identification de chaque équation sont respec- 
tées. La première équation contient deux variables endogènes : CF, et RDR,;, et en exclut 
quatre prédéterminées : 1;_1, PIB;_1, PMR, et M,_:. L’équation est identifiée, et même 
suridentifiée, puisque 4 > 2—1.La deuxième équation contient deux variables endogènes : 
I, et PIB,, et en exclut cinq prédéterminées: CF,_1, RDR;_;,INF,, PMR, et M,_:.L'équation 
est identifiée, et même suridentifiée, puisque 5 > 2 — 1. La troisième équation contient 
deux variables endogènes : M, et PIB,, et en exclut cinq prédéterminées : CF;_1, RDR;-_1, 
I;_1, PIB,_, et INF, L’équation est identifiée, et même suridentifiée, puisque 5 > 2 — 1. 


Le programme d’instructions TSP est Le suivant : 


OPTIONS MEMORY=25; 

FREQ A; 

SMPL 1978 2002; 

READ(FILE=*C :\FRC.XLS”); 

PMR=PM/P ; 

RES=PIB-(CF+I+X-M); 

RPR=PIB-RPA; 

RDR=RPR-PRELN; 

SMPL 1979 2002: 

INF=LOG(P)-LOG(P(-1)); 

2SLSCINST=(C,CF(-1),INF,PIB(-1) IC(-1) PMR M(-1) RPÀ PRELN)) CF C RDR RDR(-1) CF(-1) INF; 
2SLSCINST=(C,CF(-1),INF,PIB(-1) I(-1) PMR M(-1) RPÀ PRELN)) I C PIB PIB(-1) I(-1); 
2SLSCINST=(C,CF(-1),INF,PIB(-1) I(-1) PMR M(-1) RPÀ PRELN)) M C PIB PMR M(-1); 


Les résultats sont : 


Equation 1 


Method of estimation = Instrumental Variable 


Dependent variable: CF 

Endogenous variables: RDR RDR(-1) 

Included exogenous variables: C CF(-1) INF 

Excluded exogenous variables: PIB(-1) I(-1) PMR M(-1) RP À PRELN 
Current sample: 1979 to 2002 

Number of observations: 24 


Mean of dep. var. = 613.704 R-squared = .996999 

Std. dev. of dep. var. = 75.2243 Adjusted R-squared = .996368 
Sum of squared residuals = 390.795 Durbin-Watson = 2.89278 [.541,1.00] 

Variance of residuals = 20.5682 EXPZÉE = :125::497 
Std. error of regression = 4.536521 

Estimated Standard 

Variable Coefficient Error t-statistic P-value 
(8 75.3664 19.9505 3./7767 [.000] 
RDR .889724 .148381 5.99621 [.000] 
RDR(-1) -.616957 .147234 -4,19030 [.000] 
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CF(-1) .566376 .144285 3.925641 [.000] 
INF -182.553 63.2190 -2.88762 [.004] 
Equation 2 
Method of estimation = Instrumental Variable 
Dependent variable: I 
Endogenous variables: PIB 
Included exogenous variables: C PIB(-1) I(-1) 
Excluded exogenous variables: CF(-1) INF PMR M(-1) RPÀ PRELN 
Current sample: 1979 to 2002 
Number of observations: 24 
Mean of dep. var. = 214.343 R-squared = .992031 
Std. dev. of dep. var. = 36.6089 Adjusted R-squared = .990835 
Sum of squared residuals = 246.240 Durbin-Watson = 1.932256 [.002,.992] 
Variance of residuals = 12.3120 E’PZXE = 40.9836 
Std. error of regression = 3.50884 
Estimated Standard 
Variable Coefficient Error t-statistic P-value 
C -3.80473 5.21909 -./29004 [.466] 
PIB .642299 .059717 10./558 [.000] 
PIB(-1) -.623924 .065328 -9.55064 [.000] 
DCE) .8/5597 .075301 11.6280 [.000] 
Equation 3 


Method of estimation 


Dependent variable: M 


= Instrumental Variable 


Endogenous variables: PIB 
Included exogenous variables: C PMR M(-1) 
Excluded exogenous variables: CF(-1) INF PIB(-1) I(-1) RPA 
PRELN 
Current sample: 1979 to 2002 
Number of observations: 24 
Mean of dep. var. = 221.583 R-squared = .984135 
Std. dev. of dep. var. = /78.6838 Adjusted R-squared = .981755 
Sum of squared residuals = 2259.10 Durbin-Watson = 1.525690 [.000,.880] 
Variance of residuals = 112.955 E’PZXE = 1614.40 
Std. error of regression = 10.6280 
Estimated Standard 
Variable Coefficient Error t-statistic P-value 
Ç -/9.5457 93.2394 -.853133 [.3941 
PIB .117524 .083857 1.40149 [.161] 
PMR 1.41185 25.9975 .054307 [.957] 
MC-1) .804479 .143033 5.624427 [.000] 
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EXERCICE 2 MODÈLE MACROÉCONOMIQUE ET MÉTHODE 3MC 


Énoncé 


Sur la base des données de l’exercice 1, estimez le même modèle que celui de l'exercice 
précédent, en utilisant cette fois la méthode des triples moindres carrés. Travaillez avec 
TSP. 


Le programme d’instructions TSP est Le suivant : 


OPTIONS MEMORY=25 ; 
FREQ A: 
PL 1978 2002; 
EAD(FILE="C :\FR.XLS"); 
R=PM/P ; 
S=PIB-(CF+I+X-M) ; 

R=PIB-RPA: 

R=RPR-PRELN; 

PL 1979 2002; 

INF=LOG(P)-LOG(P(-1)); 

FORMCVARPREF=A) CON CF C RDR RDR(-1) CF(-1) INF: 

FORM(VARPREF=B) INV I C PIB PIB(-1) I(-1): 

FORM(VARPREF-=C) IMP M C PIB PMR M(-1); 

3SLS(INST=(C,CF(-1),INF,PIB(-1) I(-1) PMR M(-1) RPÀ PRELN)) CON INV IMP; 


1 D om 


Les résultats sont : 


THREE STAGE LEAST SQUARES 


EQUATIONS: CON INV IMP 


INSTRUMENTS: C CF(-1) INF PIB(-1) I(-1) PMR M(-1) RPÀ PRELN 


MAXIMUM NUMBER OF ITERATIONS ON V--COV MATRIX OF RESIDUALS = 0 
NOTE => The model is linear in the parameters. 
Working space used: 5025 
STARTING VALUES 

AO ARDR ARDRI ACFI AINF 
VALUE 0.00000 0.00000 0.00000 0.00000 0.00000 

BO BPIB BPIBI BIl CO 
VALUE 0.00000 0.00000 0.00000 0.00000 0.00000 

CPIB CPMR CM 

VALUE 0.00000 0.00000 0.00000 
F= 0.11622E+08 FNEW= 17/80.9 ISQ/= 0 STEP= 1.0000 CRIT= 0.11621E+08 


CONVERGENCE ACHIEVED AFTER 1 ITERATION 
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2 FUNCTION EVALUATIONS. 


END OF TWO STAGE LEAST SQUARES ITERATIONS (SIGMA=IDENTITY). THREE STAGE 
LEAST SQUARES ESTIMATES WILL BE OBTAINED USING THIS ESTIMATE OF SIGMA: 


RESIDUAL COVARIANCE MATRIX 


CON INV IMP 
CON 16.28313 
INV 0.072019 10.25999 
IMP 2.37859 -1.17726 94.12937 


WEIGHTING MATRIX 


CON INV IMP 
CON 0.24782 -0.0013808 -0.015148 
INV 0.31220 0.011964 
IMP 0.10334 


Working space used: 5025 
F= 28.337 FNEW= 28.284 ISQZ= O0 STEP= 1.0000  CRIT= 0.53014E-01 
CONVERGENCE ACHIEVED AFTER 1 ITERATION 


4 FUNCTION EVALUATIONS. 


THREE STAGE LEAST SQUARES 


Residual Covariance Matrix 


CON INV IMP 
CON 16.07974 
INV -0.017320 10.37265 
IMP 3.45061 -2.00440 94.29357 


Weiïghting Matrix 


CON INV IMP 
CON 0.24782 -0.0013808 -0.015148 
INV 0.31220 0.011964 
IMP 0.10334 


Covariance Matrix of Transformed Residuals 


CON INV IMP 
CON 23.70022 
INV -0.16422 24.26539 
IMP 0.67/084 -0.62395 23.91249 
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Number of obse 


rvations = 24 E’PZXE 


Standard 
Parameter Estimate Error 
AO 73.4501 17.7272 
ARDR .872145 .131/794 
ARDRI -.610985 .130769 
ACF1 .583227 .128190 
AINF -177.335 56.1668 
BO -3.84120 4.76406 
BPIB .648311 .054476 
BPIB1 -.629440 .059594 
BI .8/72549 .068693 
CO -/2.2268 84.9437 
CPIB .113072 .076427 
CPMR -1.05115 23.6783 
CMI .807163 .130411 


derivatives 


Equation: CON 


Dependent vari 
ean of 
Std. dev. of 


Sum of squared 


Variance of 


Std. error of 


Du 


Equation: INV 
Dependent vari 


Mean of 
Std. dev. of 


Sum of squared 


Variance of 


Std. error of 


Du 


Equation: IMP 


Dependent vari 
Mean of 
Std. dev. of 


Sum of squared 


Variance of 


Std. error of 


Du 


able: CF 


dep. var. 
dep. var. 
residuals 
residuals 
regression 
R-squared 
bin-Watson 


able: 


dep. var. 
dep. var. 
residuals 
residuals 
regression 
R-squared 
bin-Watson 


able: M 


dep. var. 
dep. var. 
residuals 
residuals 
regression 
R-squared 
bin-Watson 


613.704 
75.2243 
385.914 
16.0797 
4.00996 
.997037 
2.87331 


214.343 
36.6089 
248.944 
10.3727 
3.22066 
.991944 
1.95254 


221.583 
78.6838 
2263.05 
94.2936 
9.7/71049 
.984108 


— 28.2839 


t-statistic 
4.14337 
6.61746 
-4.67223 
4.54971 
-3.15729 
-.806288 
1.9009 
-10.5621 
2.7022 
-.850291 
.47948 
.044393 
6.18939 


[.517,1.00] 


[.003,.994] 


= 1.53330 [.000,.884] 
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EXERCICE 3 MODÈLE MACROÉCONOMIQUE ET MÉTHODE MV 


Énoncé 


On spécifie un modèle macroéconomique dont les équations structurelles sont les sui- 
vantes : 


In (CF,) — In (CF_1) = où + @2(In (RDR:) — In (RDR;-1)) + a3 In (RDRs-1) 
+ on (CF;_1) + à (in (P:) — In (Ps1)) + wir 
In (4) — In (1) = & + (In (PIB) — In (PIB;_1)) + 3 In (L:_1) + on (PIB;_1) 
+ ln (CF,_1) + a(In (P;) — In (P;_1)) + vx 
In (M) — In (M;_1) = où + o In PIB, — In PIB;_1 + 03 In (PMR) — In (PMR; 1) 
+ on (PIB;_;) + an (PMR; _;) + œln (M,_:1) + us 


Les identités sont : 


PIB, — CE, + I, + RES, + X, — M, 
RPR; — PIB, a RPA, 
RDR; = RPR; — PRELN, 


Sur la base des données de l’exercice 1, estimez ce modèle macroéconomique par la 
méthode FIML. Travaillez avec TSP. 


Le programme d’instructions TSP est Le suivant : 


OPTIONS MEMORY=25; 
FREQ À; 
SMPL 1978 2002; 

READ(FILE=*C :\FRC.XLS’); 


LP=LOG(P); 
LPM=LOG(PM) ; 
D « 


L 1979 20027; 

CELC (ETS 

NPC 
LPMR=LOGCPMR)-LOGC(PMR(-1)); 
LM=LM-LM(C-1) ; 
LP=LOG(P)-LOG(P(-1)); 
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DLPIB=LPB-LPB(-1); 

DLI=LI-LI(-1) 

PARAM AI A2 A3 A4 AS B1 B2 B3 B5 B4 C1 C2 C4 C5 C3 C6; 

OLSQ DEC C DEY LY(-1) LC(-1) DLP; 

SET Al=@CoeF : 

SET A2=@CoeF(2 

SET A3=@CoeF(3 

SET A4=@CoeF(4 
5 
P 


SET A5=@CoeF 
OLSQ DEI C DE 
SET B1=@CoeF 
SET B2=@CoeFr(2 
SET B3=@CoeFr(3 
4 
P 


B LI(-1) LPB(-1) DLP: 


SET B4=@CoeF 
OLSQ DIM C DE 
SET C1=@CoeF 

SET C2=@CoeFr(2 
SET C3=@Coer(3); 
SET C4=@CoeF(4); 
SET C5=@CoeFr(5); 
SET C6=@CoeF : 
T IDRDR RDR=RPR-PRELN; 


B DLPMR LPMR(-1) LPB(C-1) LMC-1); 


T 
[ex] 
— 


DBLE 'BLISLIS ICS 19% 

DLPB LPB=LOG(PIB); 

DLPIB DLPIB=LPB-LPB(-1); 
D 

D 

D 


PIB PIB=CF+I-M+XHRES; 
RPA ; 
DLM DLM=LM-LM(-1); 


À 
Ù 

po) 

A 
Ù 

2 
Il 
Le) 

| runs | 

œ 
l 


DLY+AGXLY(-1)+A4XLC(-1)+ASXDLP; 
L'EQI DLI=B1+B2*DLPIB+B3*XLI(-1)+B4*LPB(-1)+B5*DLP; 
L'EQM DLM=CI+C2XDLPIB+C3XDLPMR+CAXLPMR(-1)+CSXLPB(-1)+C6*LM(-1):; 
L(maxit=1000, HCOV=G, ENDOG=(CF,I,M,LC,LI,LM,DEC,DLI,DEM,RDR, 
LY,DLY,RPR,LPB,DLPIB,PIB)) EQC EQI EQM IDRDR IDDIC IDDLY ILC ILY 
IDLPB IDLPIB IDPIB IDRPR IDDLM ILM ILI IDDLI; 


Il faut d’abord générer toutes les variables contenues dans les équations structurelles et 
les identités, à partir des données du fichier FR.xls. Ensuite, on définit les paramètres à 
estimer avec l'instruction PARAM : les A; correspondent aux à;, les B; aux B; et les C; aux y;. 
On estime chaque équation du modèle par MCO et l’on utilise les valeurs estimées des 
coefficients, qui sont des valeurs de départ convenables, pour les paramètres à estimer 
par FIML. Après chaque estimation par MCO, TSP garde en mémoire le vecteur des 
coefficients estimés dans une variable appelée @CoeF. Les instructions SET affectent les 
valeurs successives de ce vecteur aux paramètres correspondants. Les instructions IDENT 
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définissent chaque identité en lui donnant un nom. Les instructions FRML définissent 
chaque équation structurelle en lui donnant un nom. L’'instruction FIML demande 
l'estimation d’un système d’équations par la méthode du maximum de vraisemblance 
à information complète. Elle doit être suivie des noms de toutes les équations et identités : 
EQC, EQT, EQM, IDRDR, IDDLC, IDDLY, I LC, ILY, IDLPB, IDLPIB, IDPIB, IDRPR, IDDLM, 
ILM, ILI, IDDLI. L'option maxit=1000 limite TSP à un maximum de 1 000 itérations, 
dans ses tentatives d'obtenir la convergence des valeurs estimées. L'option HCOV=G requiert 
une méthode spécifique pour le calcul de la matrice de variance et de covariance estimées 
des coefficients estimés, qui détermine les valeurs des écarts types (ou standard errors) de 
ces derniers. La liste des variables endogènes doit être mentionnée : CF, I, M, LC, LI, LM, 
DLC, DLT, DLM, RDR, LY, DLY, RPR, LPB, DLPIB, PIB. 


Les résultats de l'instruction FIML sont les suivants : 


Equations: E 


Identities: 
ILC IDD 


Endogenous v 
RPR LPB 


NOTE => The 
Working spac 


VALUE 

VALUE 

VALUE 

VALUE 

F= 232.06 
F= 206.29 
F=, <207:59 
F= 98.19 
FE 98.10 
F= 96.95 
F= 96.88 
F= 96.86 
= 96.84 
F= 96.83 
F= 96.83 
F= 96.83 
F= 96.83 
F= 96.82 
F= 96.82 


Information Maximum Likelihood 


QC EQI EQM 


ariables: 
DLPIB PIB 


odel 
e used: 9939 


AI 
0.6/685 


A5 
-0.34865 


-0.0484 


= 2 
= 2 


A OO 9 20 mi 


O0 O0 O0 OT O0 O0 O0 O0 O0 O0 OT OO O1 M mm 


06. 
02. 
98. 


98 


96. 
96. 
96. 
96. 
96. 
96. 
96. 
96. 
96. 
96. 
96. 


IDDLI ILT ILM IDDLM IDRPR I 
LY IDDLC IDRDR 


CF I M LC LI LM D 


is linear in the para 


STARTING VA 
A2 
0.81852 
Bl 
-0.061901 
B5 
0.00000 
C4 
-0.19344 
29 SQZ= 
59 SQZ= 
19 SQZ= 
.10 SQZ= 
95 SQZ= 
88 SQZ= 
86 SQZ= 
84 SQZ= 
83 SQZ= 
83 SQZ= 
83 SQZ= 
83 SQZ= 
82 SQZ= 
82 SQZ= 
82 SQZ= 
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CLÉNESx 


LUES 

A3 

0.32262 

B2 

2.83055 

CI 

-1.03046 

C5 

0.32068 

3 STEP= 4 

STEP=: 0. 

2 STEP= 2. 
STEP= 
STEP= 

2: :STEPR= 2% 
STEP= 

2 STEP= 1 2 
STER= 

2 STEP= 2. 
STEP= 

2 STER=. 22% 
STEP= 

2YSTEP=. 2: 
STEP= 


DPIB IDLPIB IDLPB ILY 


LC DLI DLM RDR LY DLY 


A4 


-0.43377 


B3 


-0.12893 


C2 
2.85777 


C6 


-0.22365 


CRIT= 
CRIT= 
CRIT= 
CRIT= 
CRIT= 
CRIT= 
CRIT= 
CRIT= 
CRIT= 
CRIT= 
CRIT= 
CRIT= 
CRIT= 
CRIT= 
CRIT= 


La en ee QE cn EE ee D De Es an 


20.690 
15.929 
6.4935 
3.4928 
2.4203 
.69374 
.38891 
LS OT 
.12607 
.44010 
.45739 
.14973 
.16746 
.51582 
.61612 


-01 
-0T 
-01 
-01 
- 02 
- 02 
-02 
- 02 
-03 
-03 
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96. 
96. 
96. 
96. 
96. 
96. 
96. 
96. 
96. 


82 
82 
82 
82 
82 
82 
82 
82 
82 


Aa Po en De Dr D ee D 


OT O0 OT OT OI OI OI m1 mm 


96. 
96. 
96. 
96. 
96. 
96. 
96. 
96. 
96. 


CONVERGENCE ACHIEVED AFTER 


EQC 
EQI 
EQM 


Number of observations = 
Schwarz B.I.C. 


Parameter 


A 
A2 
A3 
A4 
A5 
B 
B2 
B3 
B4 
B5 


C2 
C3 
CA 
C5 
C6 


Standard Errors computed from quadratic form of analy 


105 FUNCTION EVA 


0.000097038 
0.00015629 
-0.00021264 


Estimate 


.532522 
.209422 
.385103 
-.473620 
-.360606 
-.244347 
1.73283 
252597 
-207535 
-. 225663 
-2.21637 
4.87888 
-.091867 
-.023498 
.460320 
-.197906 


derivatives (Gauss) 


Equation: 
Dependent variable: DLC 


EQC 


2 
2 


Standard 


82 
82 
82 
82 
82 
82 
82 
82 
82 


SQZ= 
SQZ= 
SQZ= 
SQZ= 
SQZ= 
SQZ= 
SQZ= 
SQZ= 
SQZ= 


24 ITERATIONS 


LUATIONS. 


Full Information 


.0000 
.0000 
.0000 
.0000 
.0000 
.0000 
.0000 
.0000 
.0000 


Maximum Likeliïhood 


Residual 


EQI 


0.00043666 
-0.00016227 


4 
22.248 


Error 


.205085 
.128189 
.085915 
.101261 
.110658 
.473062 
.283057 
.074006 
.108505 
.226928 


al 


.37875 


.520245 
.154722 
.071327 
.277728 
.116505 


Mean of dep. var. = 


Std. dev. of dep. var. 


Sum of squared residuals 


Equation: 
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EQI 


Variance of residuals 


.018001 
.011672 


Log likelihood = -196.823 


.232892E-02 
.970385E-04 


Équations multiples en univers stationnaire 


Covariance Matrix 


EQM 


0.0010587 


t-statistic 
2.59658 
1.6337/0 
4.48235 
-4.67721 
-3.25875 
-.516522 
6.12182 
-3.41320 
2.09700 
-.994428 
-1.60752 
9.37804 
-.593753 
-.329438 
1.65745 
-1.69869 


P-value 


09] 
02] 
00] 
00] 
01] 
05] 
00] 
01] 
36] 
20] 
08] 
00] 
:5031 
.742] 
.097] 
.089] 


Or D O00O0MmmOOOmr CO 


CR 
CR 
CR 
CR 
CR 
CR 
CR 
CR 
CR 


CIC TITSE 


Std. error of regression = 


R-squared 
Durbin-Watson 


D CS CS Ce Eee 


.17904E-03 
.22777E-03 
.62537E-04 
.84587E-04 
.21967E-04 
.31545E-04 
./7583E-05 
.11809E-04 
.27549E-05 


.985081E-02 
.257131 
.846172 


Dependent var 


Mean 0 
Std. dev. o 


Sum of squared residuals 


Variance of 


Equation: EOM 
Dependent var 


Mean 0 
Std. dev. o 


Sum of squared residuals 


Variance of 


residuals 


iable: DLI 

f dep. var. = 

f dep. var. 
residuals 

iable: DLM 

f dep. var. 

f dep. var. 


.022827 Std. error of regression 
.039421 R-squared 
.010480 Durbin-Watson 
.436658E-03 

.046139 Std. error of regression 
.043833 R-squared 
.025409 Durbin-Watson 
.105871F-02 
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.020896 
.743255 
.834280 


.032538 
664563 
1.31892 
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Ce chapitre définit les processus stochastiques 
stationnaires et non stationnaires, et insiste sur la 
distinction entre processus à tendance déterministe et à 
tendance stochastique. Il présente également les 
principaux tests de racine unitaire, décrit les modèles 
ARMA et ARIMA et explique comment les utiliser pour 


modéliser l’évolution d’une série temporelle. 


El Processus stochastiques 


Les séries temporelles observées sont considérées comme des réa- 
lisations de processus stochastiques, définis jusqu’à présent (voir 
chapitre 1) comme des successions temporelles de variables aléa- 
toires représentant un même concept. L'objet de cette section est 
de préciser la définition des processus stochastiques et d’examiner 
leurs propriétés. 

Un processus stochastique X ou {X,} est une variable aléatoire indi- 
cée par Le temps, multivariée et dont chaque composante univariée 
représente toujours le même concept économique quelle que soit 
la période considérée. 


X = (hr.,n = (5.1) 
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La réalisation d’un processus stochastique X est une série temporelle observée, dont 
chaque composante est une réalisation d’une composante différente de X : 


- La variable aléatoire univariée X, a une réalisation x1. 
+ La variable aléatoire univariée X; a une réalisation x. 


+ La variable aléatoire univariée X, a une réalisation x,. 


X1 
. X2 . . 
La série temporelle observée x = {x:},_1,.., = | . | est donc une réalisation du pro- 
Xn 
Xi 
X 
cessus stochastique X = {X,} — | . |. Toute série temporelle observée est considérée 
Xn 


comme la réalisation unique d’un processus stochastique, qui aurait pu générer d’autres 
séries de réalisations. 


Exemple 


La série de l'investissement, telle qu'elle est publiée par l'INSEE dans les comptes nationaux, 
est considérée comme la réalisation d'un processus stochastique I. L'investissement observé à 
chaque période est considéré comme la réalisation d’une variable aléatoire univariée « inves- 
tissement à la période t ». En d'autres termes, à chaque période, on a une variable aléatoire 
« investissement » distincte et pour chaque variable « investissement », on n'a qu'une réalisation. 
Ainsi l'investissement observé en 70, ir, est une réalisation d'une variable aléatoire univar- 
riée 130. L'investissement observé en 71, i1, est une réalisation d’une variable aléatoire univariée 
In, et ainsi de suite. 


Les variables aléatoires « investissement de 70 », 13, et « investissement de 71 », I, et plus 
généralement les variables « investissement » de toutes les périodes, sont distinctes. Le vecteur 
formé par toutes ces variables aléatoires univariées est une variable aléatoire multivariée, le 
processus stochastique de l'investissement : 


T0 170 
T1 i71 , 
{i}s270..., 90 = |» Se — … | = Grhi270..,90 
- réalisation - 
10 190 
Processus stochastique Série temporelle observée 


Un processus stochastique X ou {X,} est caractérisé par : 
+ une espérance E(X,) à chaque période ft : E(X:), E(X2) ..… 
+ une variance V(X,) à chaque période t : V(X:), V(X2) 


+ des covariances Cov(X;, X; 9) pour toutes les périodes f et tous les retards 8 : 
Cov(X, Xi), Cov(X3, Xi), Cov(X3, X) air 
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Chapitre 


PROCESSUS STOCHASTIQUES STATIONNAIRES 


Un processus stochastique X ou {X,} est stationnaire si : 

+ EX) = hx Vi, 

° V(X:) = de Vt; 

+ Cov(X;, X:_0) = v(0) Vf, VO. 

En d’autres termes, X est stationnaire si les conditions suivantes sont réunies : 
+ L’espérance est constante (elle est inchangée dans le temps). 

+ La variance est constante dans le temps. 


+ La covariance entre une composante d’une date t et une composante d’une autre date 
t — q ne dépend que de l’écart de temps (le « retard ») 8 entre les dates, et non de la 
date t elle-même : par exemple Cov(X}2, X70) = Cov(Xs9, X87). 


Une série temporelle observée est donc une réalisation d’un processus stochastique 
stationnaire si elle fluctue autour d’une valeur moyenne stable, si l'amplitude moyenne 
de ses fluctuations reste stable dans le temps, et si la manière dont ses valeurs sont 
liées aux valeurs précédentes se répète de façon stable dans le temps. Par exemple, une 
série observée ayant une forme sinusoïdale régulière est une réalisation d’un processus 
stochastique stationnaire. 


La covariance Cov(X;, X;_9) entre deux composantes de dates différentes (f et { — 0) d’un 
processus stochastique est appelée autocovariance. Lorsque le processus est stationnaire, 
cette autocovariance est la même dès lors que l’écart entre les dates est inchangé. 


Le coefficient de corrélation entre deux composantes de dates différentes, appelé coefficient 
d’autocorrélation, est défini par : 


Cov (X;, X:_0) 


VV) V (X-0) 


VE : PX;,X;_9 = (52) 


Lorsque le processus est stationnaire, ce coefficient est dit d’autocorrélation d’ordre 8 ; il 
est le même dès lors que l’écart entre les dates est inchangé : 


v (0) 
VE: px, x, 0 = Fe De (5.3) 
x 


Puisque v(0) = Cov(X;, X:_0) = Cov(X;,, X;) = V(X:) = 6%, on a toujours po = 1. 


Lorsque le processus stochastique est stationnaire, on peut dessiner le graphique des 
différents coefficients d’autocorrélation en fonction du retard (ou écart de dates) 6. Ce 
graphique est l’autocorrélogramme théorique du processus. Il indique comment une 
composante de date quelconque du processus est liée linéairement aux composantes des 
dates précédentes, pour des retards croissants. C’est une représentation graphique de la 
«mémoire » du processus, qui montre dans quelle mesure ses réalisations courantes sont 
influencées par ses réalisations passées. 
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Remarque 


Le concept d'autocorrélogramme n’a de sens que pour un processus stationnaire. En effet, 
en cas de non-stationnarité, les coefficients d'autocorrélation dépendent non seulement du 
retard, mais également des dates elles-mêmes. La non-stationnarité implique que, pour une 
même valeur de 8 : 


PXs,X3_0 Æ PXrr1X5+1-0 F PXr42,X542 0 É 5 


Le coefficient d'autocorrélation n'est pas identique pour toutes les dates t. Par contre, la 
stationnarité implique que, pour une même valeur de 8 : 


PXXs 0 Pen Xs41 0 — Xe, Xp2 0 7" — PE 


Le concept d'autocorrélogramme a alors un sens. 


Un cas particulier de processus stochastique stationnaire est le bruit blanc. Un processus 
stochastique X ou {X,} est un bruit blanc si : 


+ E(X,) = 0 Vt; 

VX) = 02 Vi; 

+ Cov(X;, X_0) = 0 Vi, VO Z 0. 

Dans ce cas particulier, l'espérance des composantes est nulle à chaque période et les 
composantes de dates différentes ne sont pas liées linéairement. Une série observée qui 


correspond à une succession de valeurs de moyenne 0, de dispersion stable dans le temps 
et sans lien linéaire les unes avec les autres, est une réalisation d’un bruit blanc. 


Remarque 


Un processus stochastique est non stationnaire lorsque l'une des trois conditions de la sta- 


tionnarité n'est pas remplie. Les cas les plus fréquents de non-stationnarité sont dus à une 
espérance ou à une variance qui varie dans le temps, ou aux deux à la fois. 


1.2 TYPOLOGIE DES PROCESSUS STOCHASTIQUES STATIONNAIRES 


Représentation de Wold et filtres linéaires 


Le théorème de Wold prouve mathématiquement qu’un processus stochastique station- 
naire peut toujours être généré par la somme d’une constante et d’une combinaison 
linéaire, parfois infinie, des composantes courante et passées d’un bruit blanc. Cela se 
traduit en termes mathématiques de la façon suivante : 


{X;} stationnaire —= 
4 un bruit blanc {a,} et des coefficients 1x, V1, V2... tels que: 
VE: Xi= x + & + Vider + Vaso +... 
Cette équation est la représentation de Wold du processus stochastique stationnaire {X,}. 


Ici, l'espérance de X, est représentée par 1x et la variance de X, par o% (32%, 4? +1). On 
distingue un processus stochastique stationnaire d’un autre par : 

la spécificité des paramètres qui déterminent la fonction de densité du bruit blanc {a;} 
qui le génère ; 

la spécificité des valeurs des coefficients 11, V1, 2... Sur cette base, on met en évidence 
trois types de processus stochastiques stationnaires : 
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+ les processus autorégressifs AR(p) ou ARMA(p, 0) ; 
+ les processus en moyenne mobile MA(g) ou ARMA(O, q) ; 
+ les processus mixtes (autorégressifs et en moyenne mobile) ARMA(p, a). 


Processus stochastiques autorégressifs stationnaires 


Les processus autorégressifs peuvent s’écrire comme la somme d’une constante, de la 
valeur courante d’un bruit blanc et d’une combinaison linéaire finie de leurs valeurs 
passées. 


Un processus stochastique {X;} est dit autorégressif d’ordre p, et noté AR(p) ou 
ARMA(p, 0), si : 


VE Xi = UE per + PoXr2 + + EXD + dr 


où le processus stochastique {a,} est un bruit blanc. 


Exemple 
Processus AR(1) ou ARMA(1, 0) : 


VE: Xi=u+@iXer +& 


où {a;} est un bruit blanc. 


Exemple 
Processus AR(2) ou ARMA(2, 0) : 


VE Xi = + piXs1 + prXs- 2 + & 


où {a;} est un bruit blanc. 


Soit l'opérateur de retard L, défini par la relation suivante : L'X, — X,_;. Par exemple, 
LX, — x: S IX: — Xy-2 …. 
Si l’on utilise cette notation dans équation générique précédente, on obtient : 

Vi Xp + qilXs + pL'X,+...+ p,LPX, + a 


c’est-à-dire : 


ES RL GX. ur PLPXt = + a 
ou : 
Vi: (A—qpl—qgl—...-pl)Xt=u+a 
Le polynôme de degré p en l’opérateur de retard L(1 — @1L — @2L? — ::: — p,L?) est 


caractéristique du processus AR(p). 


Pour qu’un processus stochastique autorégressif soit stationnaire, les racines (!) du poly- 
nôme caractéristique (1 — @1L — 21? — -:: — @,L?) doivent être en dehors du cercle 
unité. Quand ces racines sont réelles, elles doivent être strictement inférieures à —1 ou 
strictement supérieures à 1. 


1. Les racines du polynôme (1 — @1L — @,L? —:.. @pLP) sont les valeurs de L telles que (1 — @1L — @L? — 
pl?) = 0. 
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Exemple 
Soit un processus AR(1) où ARMA(1,0), {X;}, défini par la relation : 


X=h+ pie + 


où a est un bruit blanc. {X;} se représente aussi de la manière suivante avec l'opérateur de 
retard : 
O—pl)X =u+a 


x je : 1 
Son polynôme caractéristique est alors (1— @1L) dont la racine 1} est —. Ce processus stochas- 
@1 


: | , ie 1 un T . 
tique {X;} est donc stationnaire si — < —1 ou si — > 1, et donc si —1 < @1 < I. 
1 @1 


Un processus stochastique autorégressif d'ordre p a par définition une représentation 
autorégressive finie (il dépend de ses valeurs passées jusqu’à un retard fini p) : 


VE: Xi + Lx, + Xi + + ELPXS + a (5.4) 


On montre que si ce processus est stationnaire, il a également une représentation en forme 
de moyenne mobile infinie des valeurs courante et passées du bruit blanc {4;}. On dit 
donc qu’un processus AR stationnaire est inversible. Cela s'illustre par l'exemple simple 
d’un processus AR(1) : 
Xi= + pie + & 

= + it + piXi-2 + 1) + a 

= + qu + pie 2 + Pidri + & 

= + qu + pi + ik + @2) + qe + @ 

= + Qu + Qf + PA 3 + Plar2 + Era + @ 
+ qi + pu + PIX + Para + Piari + dr 


(ee) (ee) 
=) it lim oiXii+ ça 
i=0 f 


1=0 
(ee) (ee) 

= ni +V qia si —1<pi<l1 
i=0 i=0 


(ee) 
Pre + qia si —1<@pi<l 
De 


Il s’agit de la forme particulière que prend la représentation de Wold d’un processus 
stochastique AR(1) stationnaire : Vf : X, = x + a; + Via + Via +: où 


Mx = et V; —_ pi Vi. 
l— 6 
On peut obtenir ce résultat d’une autre manière, en utilisant l'opérateur de retard. On sait 
1 
en effet que (1 — p1L)X,; = p + a, et donc que X, — d L ( + &). 
— 


1 l 
1. SiL = —., alors (1 — @1L) (: @1 ) = 0. 
1 @1 
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L'expression RS peut se calculer aisément par une division polynomiale usuelle : 
— 


l | A — qL) 


(A—qil)  1+qpil+çpil +... 


il 

qiL — pil” 
Qi” 

al qi 
il 

et donc: 
1 2r2 
= A Le (+ qpil+ il +...)(u+a) 
1 


l= 
= (l piL+pil +... )p+(1+qpl+pl+...)æ 

(1 gi + qi ce) p+ (a+ pla + qil'a; +.) car LU = Vi 
mn 


ee + (ar + qua + piar2 +.) 


L'autocorrélogramme simple d’un processus AR(p) stationnaire décline rapidement avec 
l'augmentation du retard, mais il ne s’annule jamais : 


Pour tout 06, po Æ 0 


Un processus AR(p) reste donc lié linéairement à toutes ses valeurs passées, aussi éloignées 
soient-elles. 


Pour un processus AR(1) stationnaire, pe = @° pour tout 6, et l’autocorrélogramme peut 
montrer : 


+ soit une diminution exponentielle sans changement de signe ; 
- soit une diminution exponentielle avec changement de signe à chaque retard. 


En revanche, l’autocorrélogramme partiel s’annule après le premier retard : 
hi Æ0 et bo—=0 pourtout8 >]1 


Pour un processus AR(2) stationnaire, l’autocorrélogramme simple peut montrer : 
+ soit une diminution exponentielle sans changement de signe ; 


+ soit une diminution exponentielle avec changement de signe à chaque retard ; 


- soit une sinusoïde s’amoindrissant. 


En revanche, l’autocorrélogramme partiel s’annule après le deuxième retard : 


db É0, bH£0 et bo—=0 6-2 
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Processus stochastiques stationnaires en moyenne mobile 


Les processus stochastiques en moyenne mobile peuvent s’écrire comme la somme d’une 
constante, de la valeur courante d’un bruit blanc et d’une combinaison linéaire finie des 
valeurs passées du bruit blanc. 

Un processus stochastique {X;} est dit en moyenne mobile d’ordre q, et noté MA(q) ou 
ARMA(O0, g), si : 


VE: Xi=p+ a — ja 1 — 024 2 — +04 (5.5) 


où le processus stochastique {a,} est un bruit blanc. 


Exemple 
Processus MA(1) ou ARMA(0, 1) : 
VE: Xi=u+ a — Gras: 


où {a,} est un bruit blanc. 


Exemple 
Processus MA(2) ou ARMA(0, 2) : 
VE: Xi=u+ a — ia 1 — Gas) 


où {a} blanc. 


La stationnarité n’impose aucune condition sur les coefficients, pourvu que tous Les 8 et la 
variance de a soient inférieurs à l'infini. Un modèle MA n’a de sens que s’il est inversible, 
ce qui implique qu'il peut s’écrire comme un modèle autorégressif avec une infinité de 
retards. Pour cela, les racines (1) du polynôme caractéristique (1—6:L—0:L?—...—0,11) 
doivent être en dehors du cercle unité. Quand ces racines sont réelles, elles doivent être 
strictement inférieures à —1 ou strictement supérieures à 1. 


L'autocorrélogramme simple d’un processus MA(q) s’annule après le g° retard : 
Pour tout 0 <g+1, pp Æ£0,  etpourtout 8 > g, po = 0 


Un processus MA(q) a donc une mémoire courte : il n’est lié linéairement qu’à son passé 
récent. Par contre, l’autocorrélogramme partiel d’un processus MA(q) ne s’annule pas, 
même pour des retards très éloignés. 


Pour un processus MA(1), l’autocorrélogramme simple s’annule après le premier retard : 
Pi Æ 0 et pe = 0 pour tout 8 > 1, tandis que l’autocorrélogramme partiel peut montrer : 


- soit une diminution exponentielle sans changement de signe ; 
+ soit une diminution exponentielle avec changement de signe à chaque retard. 


Pour un processus MA(2), l’autocorrélogramme simple s’annule après le premier retard : 
O1 Æ 0, p2 £ 0 et po = 0 pour tout 8 > 2 tandis que l’autocorrélogramme partiel peut 
montrer : 


+ soit une diminution exponentielle sans changement de signe ; 
+ soit une diminution exponentielle avec changement de signe à chaque retard ; 
+ soit une sinusoïde s’amoindrissant. 


1. Les racines du polynôme (1 — @1L — pl? —:.. @pLP) sont les valeurs de L telles que (1 — @1L — @L? — 
pl?) =0. 
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Processus stochastiques mixtes stationnaires ———_—— 


Un processus stochastique {X;} est dit mixte ou autorégressif en moyenne mobile 
d'ordres p et q, et noté ARMA(p, q), si : 


VE Xi = U+piXr + por 2 +: + PhXr-p +011 — 022 — + Ojar-q (5.6) 


où le processus stochastique {a,} est un bruit blanc. 


Exemple 


Un processus ARMA(1, 1) évolue de la manière suivante : 
VE: Xi=u+piXs-1 + 4 — O1 1 


où {a;} est un bruit blanc 


Les conditions de stationnarité sont les mêmes que celles des processus autorégressifs. 


1.3 TYPOLOGIE DES PROCESSUS STOCHASTIQUES NON STATIONNAIRES 


Processus stochastiques non stationnaires 
à tendance uniquement déterministe 


Un processus stochastique non stationnaire à tendance uniquement déterministe évolue 
de la manière suivante : 


X;=g(t)+v; pourtout t=1...n (5.7) 


où g(f) est une fonction déterministe (mécanique, non aléatoire) du temps et où v; est 
une composante aléatoire stationnaire. v est un processus stochastique stationnaire qui 
n’est pas nécessairement un bruit blanc : il peut être autocorrélé, lié à ses valeurs passées. 


Le théorème de Wold montre qu’un processus stochastique stationnaire d'espérance nulle 
peut toujours être écrit comme une combinaison linéaire des valeurs courante et passées 
d’un bruit blanc : 


Vs = Us + Vis + Vous 2 +... pourtoutf 
où u, est un bruit blanc. Si l’on utilise la notation de l'opérateur de retard, on obtient : 
vw = (+1 +\Ll?+...)u = V(L)u pour tout ft 


où W(L) est un polynôme en lopérateur de retard L. Un processus stochastique non 
stationnaire à tendance déterministe uniquement évolue de la manière suivante : 


X; = gt) +WY(L)u pourtout f=1...n (5.8) 


Vu que la partie aléatoire v, de X, est stationnaire, la non-stationnarité de X, est inhérente 
uniquement à sa partie déterministe g(f). 
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Exemple 


Soient g(f) un polynôme du premier degré en + et v, un bruit blanc [tous les 1; — 0 et donc 
v, = w). L'évolution de X, est décrite par la relation suivante : 


Xs=U+Bt+u Vi=1...n 


Le terme 1 + Bt est la partie déterministe de X,, à une tendance déterministe linéaire. Le terme w, 
est la partie aléatoire ou stochastique de X; : elle est stationnaire. 


Exemple 


Soient g(#) un polynôme du deuxième degré en t et v, un bruit blanc [tous les 1; = 0 et donc 
v, = w). L'évolution de X, est décrite par la relation suivante : 


Xi=u+Bit+Bit tu Vi=l...n 


Le terme a + Bit + B11? est la partie déterministe de X;, à tendance déterministe quadratique. Le 
terme u, est la partie aléatoire ou stochastique de X, : elle suit un modèle MA(1) stationnaire. 


Exemple 


Soient g(f) un polynôme du premier degré en f et v, un MA(1) [les 1; = 0 pour ; > 1 et donc 
ve = + Viw1]. L'évolution de X, est décrite par la relation suivante : 


Xi=p+Bt+u+ Vi Vt=l...n 


Le terme 1 + Bt est la partie déterministe de X;, à tendance déterministe linéaire. Le terme 
us + Viu-1 est la partie aléatoire ou stochastique de X, : elle est stationnaire. 


Exemple 
Soient g(f) un polynôme du premier degré en + et v, un modèle AR(2) stationnaire [tous les 
? 
W; sont différents de O, et v, = 1). l'évolution de X; est décrite par la relation 
1— il — pl? 


suivante : 
Xi=um+Bt+v OÙ v = Qivr-r + pavr-2 + Vt=1l...n 


La fonction 11 + Bt est la partie déterministe de X;, à tendance déterministe linéaire. Le terme 

u A ; A k : A 
———"— est la partie aléatoire ou stochastique de X; : cette partie est stationnaire. 
1 — @iL = @2L? 


Pour simplifier la présentation des caractéristiques d’un processus à tendance déterministe 
linéaire, on se limite au cas le plus fréquent : 


X;=h+ff+v où v, = WY(Lju, (5.9) 
L'espérance de X, varie dans le temps de manière déterministe : 
EX) =u+$t Vi=1...n (5.10) 


puisque E(v:) = 0, Vt=1...n. 
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On peut expliciter la valeur de X, et de son espérance à chaque période : 
t=l: Xi =h+B+n et EX) =u+$ 
t—2: X=p+2B8+"m et E(X2) = pu +28 
E=-3; X3— [ue 3B v3 et E(X3) = + 3B 


X; augmente mécaniquement de 18 à chaque période. À chaque période, la partie aléatoire 
de X, est v,, qui est stationnaire. On dit que X, est « stationnaire autour d’une tendance 
déterministe ». L'augmentation mécanique de l’espérance est la seule cause de la non- 
stationnarité de X,, qui est de nature purement déterministe : la partie déterministe de 
X, n’est pas stationnaire, contrairement à la partie aléatoire de X,. La variance de X, est 
constante dans le temps parce que v, est stationnaire : 


VOH=VO=S v=liin (5.11) 


Sur les valeurs ultérieures du processus, l'effet d’un choc aléatoire u, est temporaire, 
puisque son impact sur les valeurs successives X,,1,X;,2... s’estompe progressivement. 
En effet, un choc u, en f affecte X,,, uniquement par la manière dont v, est lié à v,,;. Or v, 
est stationnaire : le lien entre v, et v,,; s’estompe au fur et à mesure que l’écart de temps i 
s'accroît. Si est un bruit blanc, un choc u, n’a d’effet que sur X,, et non sur X,41, Xy12 ... 


Processus stochastiques non stationnaires à tendance stochastique 
Les processus stochastiques non stationnaires à tendance stochastique sont dits intégrés 
ou à racines unitaires. 


Un processus stochastique est non stationnaire à tendance stochastique quand une ou 
plusieurs racines unitaires figurent dans sa partie autorégressive, ce qui implique que la 
somme de ses coefficients autorégressifs est égale à 1. 


Tout processus {X,} peut en effet être représenté approximativement par un modèle AR(p), 
où p est suffisamment grand pour capter toute la dynamique de {X;} : 


VE Xi = UE ir + PoXs2 + + EX + (5.12a) 


Si l’on utilise la notation de l'opérateur de retard, on obtient : 


VE: (—qil—ql—...—ç4,L)X;=u+uw (5.12b) 


où le processus stochastique {u,} est un bruit blanc. 


X; est à tendance stochastique si @1 + @2 + : -: + @, = 1. Cela implique qu’une racine 
unitaire figure dans le polynôme caractéristique 1 — @1L—2L?—:-:—,L? du processus. 


Exemple 


Soit le processus X; tel que : 
Xi= Xi ++ 


où u, est un bruit blanc et 1 est une dérive. Un tel processus est appelé « marche au hasard 
avec dérive » ou « marche aléatoire avec dérive ». La précédente équation est équivalente à : 


XX = + 
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PI Tests 


X,—X;,_1 est donc stationnaire et il suffit de différencier une fois X, pour obtenir une expression 
stationnaire. On dit que le processus X; est intégré d'ordre 1. Il peut être représenté par la 
relation : 

A-LX=h+uw 


La racine du polynôme caractéristique (1 — L) est égale à 1. On dit donc que le processus X; a 
une racine unitaire. On peut expliciter la valeur du processus et celle de sa variance à chaque 
période : 


t=1: Xi =u+Xo+u et EXi)=n+Xo, V(X) = 0% 
t=2: X = + Xi + 0 = 2h + Xo + 1 + et EX) = 2h + Xo, V(X) = 202 
t=3: X3 = + X2 + u3 = 3h + Xo + ui + ui + us et E(X3) = 3h + Xo, V(X) = 302 


Le processus X, se forme par accumulation des chocs aléatoires u,, si bien que sa variance 
augmente avec le temps. Il s'agit d’un cas de non-stationnarité d’origine aléatoire, stochas- 
tique : l'accumulation de chocs aléatoires est la tendance stochastique car elle fait augmenter 
la variance dans le temps. En toute période t, le processus vaut donc : 


X; = pt + Xo + (ui + u2 + us +... + us) 


Cela implique que : 
EX)=ut+Xo et V(X)= to? 
La somme (41 +12 + us +--:+ u,) est la tendance stochastique et la partie déterministe de X, est 


Lit + Xo. À la tendance stochastique s'ajoute une tendance déterministe si 1 est différent de 0; 
sinon, le processus est une marche aléatoire sans dérive. 


Les caractéristiques d’un processus stochastique X; non stationnaire à tendance stochas- 
tique sont : 


+ L'espérance de X, est constante en l’absence de dérive (terme constant) et varie dans 
le temps en cas de dérive : une tendance déterministe s'ajoute alors à la tendance 
stochastique. 


+ La variance de X, varie dans le temps. 


+ L'effet d’un choc u, est permanent : il affecte de la même manière toutes les valeurs X,: ; 
ultérieures. 


de racine unitaire 


Lorsqu'on travaille avec une ou plusieurs séries économiques observées, il est important 
de déterminer, pour chaque série, si le processus stochastique dont elle est la réalisation 
est : 


- stationnaire ; 


* non stationnaire à tendance uniquement déterministe (ou stationnaire autour d’une 
tendance déterministe) ; 


+ non stationnaire à tendance stochastique. 
L'importance de cette information est évidente dans les cas de figure suivants : 


+ On souhaite spécifier et estimer un modèle où l’évolution d’une série économique n’est 
« expliquée » que par son passé. Il faut d’abord « stationnariser » la série (établir une 
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transformation stationnaire de cette série) avant de chercher le meilleur modèle ARMA 


qui décrit l’évolution temporelle de cette transformation stationnaire. Or, si une série 
est non stationnaire, la nature de sa transformation stationnaire diffère en fonction de 
la tendance (déterministe uniquement ou stochastique) du processus de cette série. 


Exemple 


Soit un processus stochastique X non stationnaire à tendance stochastique, et tel que X; — 
X;-1 + w, où u, est un bruit blanc. Dans ce cas, la transformation X; — X;_1 est stationnaire. 
Le modèle ARMA appliqué à une telle transformation est alors appelé « modèle ARIMA », où le 
« I» rappelle qu'on modélise une transformation stationnaire d’une série « I »ntégrée. 


Soit un processus stochastique X non stationnaire à tendance uniquement déterministe et tel que 
X; = a+ bt+ uw, où u, est un bruit blanc. Dans ce cas, la transformation X; — bt, ou X; — a — bt, 
est stationnaire. 


+ On souhaite estimer un modèle linéaire reliant plusieurs séries économiques (par 
exemple une variable dépendante et une ou plusieurs variables explicatives) et tester des 
hypothèses sur les paramètres de cette relation. Les techniques d’inférence statistique 
à utiliser sont différentes en fonction de la nature des processus stochastiques de ces 
séries : 

— Les techniques d’inférence statistique classique (voir chapitres 2 et 3) sont valables à 
condition qu'aucune série de la relation n’ait une tendance stochastique. 


— Les techniques liées à la problématique de la cointégration s’imposent lorsque des 
séries de la relation ont une tendance stochastique. 


Les tests de racine unitaire permettent de tester l'hypothèse H, qu’une série économique 
observée est la réalisation d’un processus stochastique non stationnaire à tendance stochas- 
tique, contre l'hypothèse H; que ce processus est (j) stationnaire à tendance uniquement 
déterministe ou (fi) stationnaire. 


Ces tests sont basés sur l’estimation préalable d’un modèle autorégressif AR(p) censé 
approcher le vrai comportement du processus stochastique dont la série observée est une 
réalisation. 


2.1 MODÉLISATION D'UN PROCESSUS PAR UN MODÈLE 
AUTORÉGRESSIF AR(p) 


Un processus stochastique X est bien représenté par un modèle AR(p) général s’il existe 
des coefficients 11 et ;, pour i = 1...p, tels que: 


VE Xi= + piXs ir + paXe 2 +: + PhXrp + BE + us (5.13) 


où le processus stochastique {u,} est un bruit blanc. Ce modèle peut s’écrire de la manière 
suivante : 


VE: X,—Xi ii =h+(p—1)X5 1 + kXs 1 — Xi) + NX 2 — X5-3) 
A D A1 (Xp ue Xp) +Bt+u, (5.14) 


Tests de racine unitaire 161 


où le processus stochastique {,} est un bruit blanc et où : 


P—piTrpT::: + Op; 
Mi = Pa + Ps + + Gp, 
À2 = 3 + Da +: + Gp, 


Àp-2 = Pp-1 + Pp 

Àp-1 = Pp (5.15) 
Les deux formulations (5.13) et (5.14) du modèle AR(p) sont équivalentes (ce sont deux 
manières différentes de formuler le même modèle, et non deux modèles différents). Une 
formulation implique l’autre et vice-versa. La formulation (5.14) est particulièrement 
pratique pour décrire les implications d’une racine unitaire. 


Si le processus stochastique X a une racine unitaire, alors @1 + @2 + -:: + @, = 1, ce 
qui implique p = 1 ou p — 1 = 0. Tester la présence d’une racine unitaire revient donc à 
tester l'hypothèse que le coefficient de X;-_, dans la formulation (5.14) du modèle AR(p), 
en occurrence p — 1, est égal à 0. 


Si le processus X a une racine unitaire, son évolution peut donc être représentée par : 

VE XX = + XX 2) + (Xe 2 Xe 3) + pr Xe pt — Xp) + Us 
(5.16) 

Cela équivaut à : 


VE (Xi — Xi 1) — (Xe — X5)) 
=p+ Qu + hote pi — Xe — Xe) 
+ Qu + + hp) (2 — Xi) — (Xes — X4)) +. 
+ 1 (opte — Xeon) — per — Xp) + (5:17) 


La transformation X; — X;_, de X, est stationnaire si ky + 2 +: Àp_1 < 1. Dans ce 
cas, on dit que X est intégré d’ordre 1 : il suffit de le différencier une fois pour le rendre 
stationnaire. 


Si hi + 2 +: + pi = 1, la transformation X; — X,;_, a aussi une racine unitaire. 
La nouvelle transformation (X; — X,_1) — (X;_1 — X;_>) de X, est alors stationnaire si 
Ou + + per) + O3 +: + pr) +: + ps < 1. Dans ce cas, on dit que X est 
intégré d’ordre 2 : il suffit de le différencier deux fois pour le rendre stationnaire. 


Remarque 


L'ordre d d'intégration de X (il faut différencier d fois X pour le rendre stationnaire] ne dépend 
pas de p ou de p—1 (il faut spécifier un modèle autorégressif avec p retards ou p—1 différences 
retardées pour que le terme d'erreur soit un bruit blanc]. 


2.2 TESTS DE RACINE UNITAIRE CONTRE STATIONNARITÉ 
OU TENDANCE DÉTERMINISTE 


Cette section décrit les tests de l’hypothèse de racine unitaire contre l'hypothèse de 
stationnarité ou l'hypothèse de tendance déterministe. Pour détecter si un processus a 
une tendance stochastique, c’est-à-dire s’il a au moins une racine unitaire, et donc s’il 
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est intégré, on utilise souvent les tests de Dickey et Fuller [FULL 1996] [DIC 1979], 
basés sur une estimation préalable d’un modèle autorégressif AR(p) avec suffisamment de 
retards, donc avec une valeur suffisante de p, pour que ce modèle soit une approximation 
acceptable du vrai processus stochastique dont la série observée est une réalisation. 
Parmi les différentes catégories de tests proposés par Dickey et Fuller, on va s'intéresser 
à la catégorie des tests de la t-stat, les plus utilisés. Trois types de tests figurent dans cette 
catégorie selon que le modèle ne contient ni constante ni tendance, qu’il contient une 
constante mais pas de tendance, ou une constante et une tendance. Ici, on ne présente que 
deux de ces trois types, ceux dont l’usage est le plus fréquent. On présente ensuite d’autres 
tests, plus récents, qui ont souvent de meilleures propriétés sur de petits échantillons. 


Tests de Dickey et Fuller avec constante et tendance 


Ces tests permettent de vérifier l’hypothèse nulle qu'un processus stochastique est à 
tendance stochastique, avec également une tendance déterministe, contre l’hypothèse que 
le processus est à tendance uniquement déterministe (donc contre l'hypothèse qu'il est 
«stationnaire autour d’une tendance détermininiste »). 


Ces tests sont basés sur l’estimation d’un modèle AR(p), avec constante et tendance, 
adéquat pour la série à laquelle on s'intéresse, c’est-à-dire avec suffisamment de retards 
(donc avec une valeur suffisante de p) pour que ce modèle soit une approximation 
acceptable du vrai processus stochastique dont la série observée est une réalisation. Une 
fois la valeur convenable de p identifiée, on dispose de l’estimation par MCO du modèle 
AR(p) avec constante et tendance, paramétré de manière à faire apparaître des différences 
premières : 


XX = + (1) Xi + À Xi — Xs2) + Ro (XXe) + 
+ kr (Xp Li X:-) da Br + € (5.18) 


On teste alors l'hypothèse de racine unitaire H6 : p = 1 etB = 0, contre l’hypothèse H : 
r < letf 0, en utilisant la statistique suivante : 


(5.19) 


Il s’agit du coefficient estimé ÿ — 1 de la variable X;_;, divisé par l'écart type estimé S;_; 
de l’estimateur ÿ — 1 de p — 1. Cette statistique est donc la t-stat du coefficient de X;_: 
dans l'équation estimée précédente. 


On prouve en effet que si p = 1 et B = 0, +, est distribué selon une table spéciale de 
Dickey et Fuller (1), la même table, quel que soit p. Ce test se réalise du côté gauche de la 
distribution spéciale de Dickey et Fuller. On prend dans la table la valeur critique telle 
qu’une réalisation de cette distribution spéciale a 5 chances sur 100 d’être inférieure à 
la valeur critique, et 95 chances sur 100 d’être supérieure. Si t. est inférieur à la valeur 
critique (donc plus grand en valeur absolue), on rejette l'hypothèse de racine unitaire H : 
p = let = 0.Si t. est supérieur à la valeur critique (donc plus petit en valeur absolue), 
on ne la rejette pas. Pour un grand échantillon, la valeur critique est —3.41. 


1. Puisque sous l'hypothèse nulle, la variable X a une tendance stochastique, les coefficients estimés de la 
régression auxiliaire (5.18) ne suivent pas l’inférence statistique classique : la statistique (5.19) ne suit donc pas 
une distribution Student comme dans le cas stationnaire. 
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En fait, des techniques différentes permettent de calculer les valeurs de la table de la 
distribution de +., et conduisent à des résultats légèrement distincts. Ainsi Fuller [FUL 
1996] et MacKinnon [MAC 1993] proposent des tables différentes de la distribution de t.. 


Si p = 1 et donc si tous les à; sont nuls, le test de Dickey et Fuller est appelé « test DF 
avec tendance ». Si p > 1, et que des différences retardées figurent donc dans l'équation 
de base, on parle de «test ADF(p — 1) avec tendance ». 


Le test n’est valable que s’il est basé sur l'estimation d’une équation autorégressive avec le p 
convenable. Il importe donc de bien choisir p. Pour cela, on estime l’équation précédente 
avec un p assez grand, on la réestime ensuite successivement avec des p plus petits, et l’on 
s'arrête à la valeur de p qui satisfait l’un des deux critères suivants : 


+ Il s’agit de la plus petite valeur p pour laquelle le résidu e de l’équation n’est pas 
autocorrélé. 


+ Il s’agit de la valeur de p qui optimise un critère d’ajustement statistique du modèle : 
par exemple celle qui maximise le critère d’information d’Akaike [AKA 1974] [AKA 
1973], le critère AIC2 [PAN 1994], le critère SBC (Schwarz Bayesian Criterion [SCH 
1978]) ou le critère HQC (Hannan-Quinn Criterion), etc. 


Il est indispensable d’utiliser un test ADF plutôt qu’un test DF dès que le résidu de 
Péquation de base du test DE (X,—X,_1 = um +(p — 1) X;_1 +Bt+u,) est autocorrélé. En 
effet, cette autocorrélation induit des distorsions importantes du seuil du test DF. Le test 
ADF(p) se comporte alors mieux (moins ou pas de distorsion du seuil du test) si la valeur 
de p est suffisante, mais perd de la puissance à mesure que p augmente. Si p est grand par 
rapport à l'effectif n des observations, la puissance du test ADF(p) est quasi inexistante. 


De manière générale, les tests DF ou ADF ont peu de puissance sur des petits échantillons 
(n petit) quand il s’agit de vérifier l'hypothèse H, : p = 1, contre l’hypothèse H : p < 1, 
et que le p « vrai inconnu » est inférieur à 1 mais proche de 1. 

Sil’on ne rejette pas l'hypothèse de racine unitaire pour X; avecletest (5.19), etsiensuiteon 
la rejette pour la variable X, — X,_; (en lui appliquant par exemple le même test (5.19) (1), le 
résultat du test peut être interprété de la manière suivante : on ne rejette pas l’hypothèse que 
la première différence de X, est stationnaire autour d’une constante non nulle (donc que X, 
est non stationnaire à tendance stochastique avec également une tendance déterministe), 
contre l’hypothèse que X; a une tendance déterministe uniquement. 


Remarque 


Le test de Dickey et Fuller avec tendance est approprié quand le graphique de la série montre 
clairement que celle-ci augmente ou diminue systématiquement dans le temps. 


Tests de Dickey et Fuller avec constante sans tendance 


Ces tests permettent de tester l'hypothèse nulle qu’un processus stochastique est à ten- 
dance purement stochastique, sans avoir également une tendance déterministe, contre 


1. Le test (5.19) appliqué à X, — X,_1 est calculé à partir des résultats de la régression : 


Xe Xi) — (Xe — Xo2) = À + ( — (Xe — Xs-2) + M (Xi — Xs-2) — (Xe-2 — Xs-5)) 
+ (O2 — Xes) — (Kes — Xe) +. 
#5 het — Xp) — (Xp — Xi-p-1)) Te Bt +e& 
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l'hypothèse que le processus est stationnaire. Ce test s'utilise donc en pratique pour une 
série temporelle dont le niveau moyen reste stable dans le temps, qui ne présente donc 
pas une tendance systématique à augmenter ou à diminuer dans le temps. 


De tels tests sont basés sur l’estimation d’un modèle AR(p), avec constante et sans tendance, 
adéquat pour la série à laquelle on s'intéresse, c’est-à-dire avec suffisamment de retards, 
donc avec une valeur suffisante de p, pour que ce modèle soit une approximation acceptable 
du vrai processus stochastique dont la série observée est une réalisation. Une fois la valeur 
convenable de p identifiée, on dispose de l’estimation par MCO du modèle AR(p) avec 
constante et tendance, paramétré de manière à faire apparaître des différences premières : 


Xi Xi = À + (P — 1) Xi + 1 (Nr — Xr2) 
+ Ro X2 — Xos) + + Rp (Xp — Xp) + @ (5.20) 
On teste alors l'hypothèse de racine unitaire H, : p = 1 et x = 0, contre l’hypothèse H: : 


r < let # 0, en utilisant la statistique suivante : 


TE — (5.21) 
NS 


Il s’agit du coefficient estimé $ — 1 de la variable X;_;, divisé par l’écart type estimé S;-_; 
de l’estimateur ÿ — 1 de p — 1. Cette statistique est donc la t-stat du coefficient de X;-_: 
dans l’équation estimée précédente. 


On prouve en effet que si p = 1 et = 0, 14 est distribué selon une table spéciale de 
Dickey et Fuller, la même table quel que soit p. Ce test se réalise du côté gauche de la 
distribution spéciale de Dickey et Fuller. On prend dans la table la valeur critique telle 
qu'une réalisation de cette distribution spéciale a 5 chances sur 100 d’être inférieure à 
la valeur critique, et 95 chances sur 100 d’être supérieure. Si t, est inférieur à la valeur 
critique (donc plus grand en valeur absolue), on rejette l'hypothèse de racine unitaire H, : 
p = let = 0.Si t, est supérieur à la valeur critique (donc plus petit en valeur absolue), 


on ne la rejette pas. Pour un grand échantillon, la valeur critique est —3.41. 


En fait, des techniques différentes permettent de calculer les valeurs de la table de la 
distribution de 1,, et conduisent à des résultats légèrement distincts. Ainsi, Fuller [FUL 
1996] et MacKinnon [MAC 1993] proposent des tables différentes de la distribution de t,.. 


Sip = 1 et donc si tous les À; sont nuls, le test de Dickey et Fuller est appelé « test DF avec 
constante et sans tendance ». Sip > 1, et que des différences retardées figurent donc dans 
l'équation de base, on parle de « test ADF(p — 1) avec constante et sans tendance ». 


Le test n’est valable que s’il est basé sur l'estimation d’une équation autorégressive avec le p 
convenable. Il importe donc de bien choisir p. Pour cela, on estime l’équation précédente 
avec un p assez grand, on la réestime ensuite successivement avec des p plus petits, et l’on 
s'arrête à la valeur p qui satisfait l’un des deux critères suivants : 


+ Il s’agit de la plus petite valeur p pour laquelle le résidu e de l’équation n’est pas 
autocorrélé. 


+ Il s’agit de la valeur de p qui optimise un critère d’ajustement statistique du modèle : 
par exemple celle qui minimise le critère d’information AIC d’Akaike [AKA 1973] 
[AKA 1974], ou le critère modifié AIC2. Ce critère se définit très simplement : si l’'AIC 
est minimisé pour un modèle à j retards (p — 1 = j), l'AIC2 implique un modèle à 
j + 2 retards [PANT 1994]. Il semble que l’usage de l’AIC2, au lieu de P'AIC, évite des 
distorsions de taille pour les tests White Symetric et Dickey et Fuller. 
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Si l’on ne rejette pas l'hypothèse de racine unitaire pour X; avec le test (21), et si ensuite 
on la rejette pour la variable X, — X;_; (en lui appliquant par exemple le même test (21)), 
le résultat du test peut être interprété de la manière suivante : on ne rejette pas l'hypothèse 
que la première différence de X; est stationnaire avec une constante nulle (donc que 
X, est non stationnaire à tendance stochastique et sans tendance déterministe), contre 
l'hypothèse que X; est stationnaire. 


Remarque 


Le test de Dickey et Fuller sans tendance est approprié quand le graphique de la 
série montre clairement que celle-ci n'augmente pas ou ne diminue pas systématique- 
ment dans le temps. Il s'applique donc à une série dont la valeur moyenne est globalement 
stable dans le temps. 


Ce test vérifie en effet l'hypothèse que X, a une espérance constante mais une variance qui 
augmente, contre l'hypothèse qu’il a une espérance et une variance constantes. 


Tests de Phillips et Perron 


De la même manière que les tests de Dickey et Fuller, les tests de Phillips et Perron 
[PHI 1988] sont calculés à partir d’une régression auxiliaire. Il s’agit en fait de la même 
régression que celle du test DF de Dickey et Fuller (donc le cas où p — 1 = 0). On distingue 
également trois cas pour cette régression : sans constante ni tendance, avec constante mais 
sans tendance, et avec constante et tendance. Les deux derniers modèles sont les plus 
utilisés, dans les mêmes conditions que les cas correspondants de Dickey et Fuller. Leurs 
hypothèses nulles sont les mêmes que précédemment. 


La différence avec la méthode Dickey et Fuller est la suivante : au lieu d’ajouter p — 1 
différences retardées à la régression, Phillips et Perron proposent une correction non para- 
métrique de la f-stat dans la régression de la variation de la variable sur son niveau retardé 
(avec ou sans constante et tendance). En effet, puisqu'on n’ajoute pas de différences 
retardées au modèle jusqu’à ce que le terme d’erreur soit un bruit blanc, le terme d’erreur 
de la régression auxiliaire est susceptible d’être autocorrélé. Il est alors justifié d'estimer 
les variances des estimateurs par une méthode robuste à l’autocorrélation, du type de la 
méthode non paramétrique de Newey et West [NEW 1987] évoquée au chapitre 4. 


Les tests de Phillips et Perron dépendent donc aussi d’un paramètre comparable au 

«p — l» des tests de Dickey et Fuller, mais celui-ci (appelé « l >) a une autre inter- 

prétation : c’est l’ordre d’autocorrélation supposé qu’on utilise dans le calcul d’une 

variance estimée de long terme du résidu de la régression auxiliaire de base. Cette variance 

estimée intervient dans le calcul des tests de Phillips et Perron. En effet, on montre que la 

distribution asymptotique de la t-stat (associée à X;_1) obtenue à partir de la régression 
2 


PRE ; ; N 1,2 ÿs 22 el 2 2 
auxiliaire dépend d’un paramètre à — : (o° — 0;) où 0, = Jim : D. Eu) et 


s 1 n e : 
o — lim E É ir u) ) est appelé « variance de long terme ». Or, o? peut être 


n— 00 n 


estimé de manière convergente par la variance empirique 62 des résidus estimés, et un 
; ; " 1 1 n ne 
estimateur convergent de à est donné par la formule à = — ) _ Wj > Url; 
n TJ =j+1 


de Newey et West [NEW 1987], ce qui fournit une estimation convergente de 0°. Dans 
cette formule, le paramètre l est un retard maximum (donc un paramètre de troncature 
des retards) imposé arbitrairement, et w;j est une certaine fonction de pondération (par 
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exemple 1 — FT) pour que l'estimation résultante de o? soit positive (voir le chapitre 4 


à propos de l'estimation d’une matrice de variance et de covariance par les formules de 
Newey et West [NEW 19871). 


On ne dispose pas de critères permettant de choisir le paramètre / convenable des tests de 
Phillips et Perron (alors que l’on sait choisir le bon « p — 1 » dans les tests de Dickey et 
Fuller). C’est bien entendu un inconvénient. Des simulations de Monte Carlo semblent 
montrer que les tests de Phillips et Perron ont une fiabilité médiocre sur de petits 
échantillons [SCH 1989], voire très médiocre selon Davidson et MacKinnon [MAC 1993]. 


Tests Weighted-Symetric 


Les tests Weighted-Symetric (WS) semblent surpasser les tests de Dickey et Fuller ou de 
Phillips et Perron sur de petits échantillons [PAN 1994]. Ils sont basés sur une régression 
pondérée à « double longueur ». 


La variable X est d’abord régressée par MCO sur une constante (pour le test WS sans 
tendance) et/ou sur une tendance (pour le test WS avec tendance). Le résidu E de cette 
première régression est ensuite utilisé à la place de X dans la régression à « double 
longueur ». 


Remarque 


Dans la première moitié de cette régression, FE, est régressé sur E;_1 et des retards de 
E, — Es, les poids étant (f — 1)/n, où n est l'effectif des observations dans l'échantillon 
disponible original. Dans la seconde moitié, E, est régressé sur E,,1 et des valeurs futures de 
Er — Er1, les poids étant (1 — (1 — #)/n). 


Le problème du choix du « bon » retard maximal p, qui implique d’ajouter p — 1 différences 
retardées au modèle sous-jacent, se pose de nouveau. Les mêmes critères que ceux utilisés 
pour les tests ADF peuvent être exploités ici pour déterminer la valeur optimale de p — 1. 
Il semble que l’usage de l'AIC2, au lieu de P'AIC, évite des distorsions de taille pour les 
tests Weighted-Symetric. 


Tests du rapport de variance (variance ratio) 
Soit un modèle AR(1), reparamétré de manière à faire apparaître une différence à gauche : 
XX =p+(p—1)X; 1 +uw (5.22) 


On suppose que les termes d’erreur successifs u, sont identiquement et indépendamment 
distribués, avec une variance 6°. Cela implique donc entre autres que le processus {u;} 
est un bruit blanc. Le cas particulier où le processus {X,} a une racine unitaire, qui se 
caractérise par p = 1, induit la trajectoire suivante pour les X, successifs (voir chapitre 3) : 


t 
Xe = Xo+ut+ Nu (5.23) 


i=1 
Cette trajectoire détermine par exemple que : 


t—2 
Xr2 = Xo+u(—2)+ uw (5.24) 


=] 


Tests de racine unitaire 


167 


168 


X—-Xii=um+tu et X;—X; 2 = 2U + u +u: (5.25) 
V(X-X;1)=02 et V(X;—X, 2) = 2020) (5.26) 


La présence d’une racine unitaire dans un processus {X,} qui est AR(1) implique la 
propriété suivante : 
VOX — Xi) 


A EE, (5.27) 
VX — X5-1) 


Le principe du test du rapport de variances [CAM 1997] est de vérifier indirectement la 
présence d’une racine unitaire en s’assurant que la propriété (5.27) est respectée par les 
données. 


En fait, plusieurs tests de ce type existent car, en utilisant le même raisonnement que 
précédemment, on montre aisément que, pour tout entier i, l'hypothèse de racine unitaire 
implique la propriété : 


VX — X;-;) = io? (5.28) 
et donc la propriété : 
VX -X; ; . . 
= RS) —=i pourtout i=1,2,3... (5.29) 
VX; — X5-1) 


Test de Bierens (1993) 


Les tests de Bierens [BIE 1993a] appelés HOAC (Higher Order AutoCorrelations) et 
DHOAC sont élaborés sur la base des autocorrélations de la série pour laquelle on veut 
tester l'hypothèse de racine unitaire. Ils dépendent de plusieurs paramètres, à savoir 11, @ 
et à, tels que > 0, à > 0,0 < à < 1, et p, qui est l’ordre d’autocorrélation maximal 
utilisé dans le test : p = (1 + an), où q = àL/(311 + 2). Ces tests sont préprogrammés 
dans le logiciel Easyresg. 


Les tests HOAC servent à tester l'hypothèse H, : X a une racine unitaire, contre l’hypo- 
thèse H, : X est un processus stationnaire. 


Les tests DHOAC servent à tester l'hypothèse H, : X a une racine unitaire avec dérive, 
contre l’hypothèse H; : X est stationnaire autour d’une tendance déterministe linéaire. Ils 
sont donc indiqués quand la série X a visiblement un profil croissant ou décroissant. 


Tests de Bierens (1997) 


Ces tests de Bierens [BIE 1997] sont des extensions non linéaires des tests augmentés de 
Dickey et Fuller, ainsi que des tests non paramétriques. Ils servent à vérifier l'hypothèse H, : 
X a une racine unitaire avec dérive, contre l’hypothèse H, : X est stationnaire autour 
d’une tendance déterministe non linéaire. Ils sont donc indiqués quand la série X a 
visiblement un profil croissant ou décroissant dont l’évolution ne semble pas linéaire. Ils 
sont préprogrammés dans le logiciel Easyreg. 


LV OX — Xi) = V Qu + 4 + wi) = V (w + 1) puisque 2u n’est pas aléatoire, donc ne varie pas, et 
n’a pas de dispersion. Seule la partie aléatoire d’une expression peut contribuer à sa dispersion ou variance. 
Puisque {u,} est par hypothèse une succession de variables distribuées indépendamment : V (4; + us_1) — 
Vu) + V(w-_1) et puisque par hypothèse u, et u,_1 sont distribués identiquement, ils ont la même variance : 
Vus) + Vus) = 0? ; 0? = 202. 
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Ces tests sont basés sur une régression auxiliaire de la forme : 


Xe — Xe = Xe + BK — X 2) +. + b(X s X5p-1) + bp 
+ bp+2P(#, DD+...+ Dpim+1P(t, m) + us (5.30) 


où y est un bruit blanc, et les P des polynômes de Chebishev en t dont on a enlevé la 
tendance, avec P(f, 1) standardisé de manière à valoir f. 


2.3 TESTS DE L'HYPOTHÈSE DE STATIONNARITÉ 
CONTRE L'HYPOTHÈSE DE RACINE UNITAIRE 


Test de Bierens et Guo 


Six tests de Bierens et Guo [BIE 1993b] sont disponibles. Les quatre premiers vérifient 
l'hypothèse H, de stationnarité, contre l'hypothèse H; de racine unitaire (sans dérive). 


Ho : Xy=c+ Ut (5.31) 
H; , X; — X;_: + U; (5.32) 


Dans ces deux équations, u, est un processus stochastique stationnaire d’espérance nulle. 


Les deux autres tests de Bierens et Guo vérifient l'hypothèse H, de non-stationnarité déter- 
ministe, ou de stationnarité autour d’une tendance déterministe, contre l'hypothèse H; 
de racine unitaire avec dérive. 


Ho: X;=c+bt+u, (5.33) 
H; : X;, — b + X3_: + U+ (5.34) 


Dans ces deux équations, u, est un processus stochastique stationnaire d’espérance nulle. 


Test de Kwiatkowski, Phillips, Schmidt et Shin 


Le premier test de Kwiatkowski, Phillips, Schmidt et Shin [KWI 1992] vérifie l’hypo- 
thèse H, de stationnarité, contre l'hypothèse H, de racine unitaire (sans dérive). 


Ho: X;=c+u, (5.35) 
H: ; X; —= X_: + Ut (5.36) 


Dans ces deux équations, u, est un processus stochastique stationnaire d’espérance nulle. 


Le deuxième test [KWI 1992] vérifie l'hypothèse Ho de non-stationnarité déterministe, 
ou de stationnarité autour d’une tendance déterministe, contre l'hypothèse H; de racine 
unitaire avec dérive. 


Ho : X;, = C + dt + U+ (5.37) 
Hi: X=d+X-;+u (5.38) 


Dans ces deux équations, , est un processus stochastique stationnaire d’espérance nulle. 
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E1 Méthodes de modélisation 
de Box et Jenkins 


Les méthodes de Box et Jenkins sont des outils systématiques qui permettent : 


+ de déterminer le meilleur modèle de type ARMA décrivant le processus stochastique 
d’une série observée ou d’une transformation stationnaire de celle-ci (1) ; 


+ d'estimer ce modèle; 
+ de Putiliser pour extrapoler les valeurs de la série. 


On recourt à cette méthode pour obtenir un modèle « expliquant » les fluctuations d’une 
série uniquement en fonction de son passé et réaliser ensuite des extrapolations des valeurs 
de la variable. Si la série laisse entrevoir un profil qui se répète de manière assez régulière, 
en d’autres termes si des récurrences importantes peuvent être exploitées pour expliquer 
la série en fonction de son passé, le choix de cette méthode a un sens. 


Entre un modèle qui « explique » une série uniquement en fonction de son passé, et 
un autre qui l’« explique » en fonction de séries qui ont une influence sur elle (facteurs 
explicatifs), le second offre un « degré d’explication » supérieur. Mais on dispose rarement 
de données sur ces variables explicatives. Dans ce cas, il faut chercher à extrapoler le mieux 
possible le passé de la série. Les méthodes de Box et Jenkins permettent d’identifier et 
d’estimer le meilleur modèle reliant la variable à son passé. Elles sont très utilisées en 
marketing. 


STATIONNARISATION DE LA SÉRIE 


Puisqu’un modèle ARMA se rapporte à un processus stationnaire, il faut d’abord définir 
une transformation stationnaire de la série si celle-ci ne l’est pas au départ. La manière de 
procéder est différente selon que la série est la réalisation d’un processus non stationnaire 
à tendance déterministe ou à tendance stochastique. Il est donc important, au préalable, 
de vérifier dans quelle situation on se trouve. 


On définit aisément les transformations appropriées des séries non stationnaires. Si X; est 
la série à modéliser et X, est la transformation stationnaire de X,, celle-ci se définit ainsi : 


X,=X,, si X, stationnaire ; (5.39a) 
X, = In(X,), si X, non stationnaire et In(X,) stationnaire ; (5.39b) 
= (LL. si X, non stationnaire et intégré d'ordre 1 ; (5.39c) 
X,=(1-L)X,, si X, non stationnaire et intégré d’ordre 2 ; (5.39d) 
X,=(1—L)In(X), siX, nonstationnaire et In(X,) intégré d’ordre 1 ; (5.39e) 
X,= (1—L)/In(X,), si X, non stationnaire et In(X;) intégré d’ordre 2;  (5.39f) 


X, = X; —p —f#, si X, non stationnaire 


et à tendance déterministe (linéaire) uniquement.  (5.39g) 


Bien sûr, dans ce dernier cas, on doit d’abord estimer [1 et 8 en appliquant la méthode des 
moindres carrés ordinaires au modèle X; = ji + Br + u.. 


1. Pour une autre présentation de ces méthodes, voir Phlips, Blomme, Vanden Berghe et Dor (1987), Analyse 
Chronologique, éditions De Boeck. 
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Quand une série mensuelle ou trimestrielle présente des variations saisonnières, la trans- 


formation stationnaire est plus complexe. Sa forme générale est alors : 


X:= (1-1) LYXx (5.40) 
ou 
RL == DEL) (5.41) 


où d est l’ordre de différenciation, s l’ordre de différenciation saisonnière, et j la fréquence 
de la série. 


La différenciation saisonnière (s non nul) sert à éliminer la fluctuation saisonnière. En 
effet, si le profil saisonnier d’une série X, trimestrielle a une ampleur stable dans le temps, 
A LE)X, (= X; — X5_à) n’a plus de fluctuations saisonnières alors que c’est (1 — L*)2X, 
XX Je 0 qui n’en a plus sile profil a une ampleur croissante dans 
le temps.Bien entendu, de telles différences saisonnières n’ont plus de fluctuations non 
saisonnières mais peuvent encore être non stationnaires. C’est la différenciation simple 
(d non nul) qui permet ensuite d’obtenir une expression stationnaire. 


Exemple 


Si une série X, de fréquence trimestrielle fluctue de façon saisonnière de manière stable [s = 1), 
et si (1 — L{)X, est intégré d'ordre 2 [ce qui se vérifie avec les méthodes décrites dans ce 
chapitre}, alors 

X=(G-L)(A-L19"X 


est une transformation stationnaire de X.. 


3.2 IDENTIFICATION DU MODÈLE 


Le principe de la méthode est de calculer et de mettre en graphique les autocorrélations 
empiriques () et les autocorrélations partielles empiriques de la transformation station- 
naire appropriée (identifiée à l’aide des méthodes du chapitre 6) de la série qu’on veut 
modéliser. On compare ces autocorrélogrammes empiriques aux autocorrélogrammes 
théoriques des processus AR(1), AR(2), MA(1), MA(2), ARMA(1, 1), etc. et l’on choisit 
le modèle le plus proche pour modéliser la série transformée. Les allures des autocorrélo- 
grammes théoriques en question ont été décrites précédemment. 


Remarque 


Pour bien interpréter les coefficients d'autocorrélation empiriques, il faut tenir compte du fait 
qu'ils sont des estimateurs des vrais coefficients d'autocorrélation de population, et qu'ils 
fluctuent donc autour des vrais coefficients d’autocorrélation avec une dispersion mesurée 
par leurs écarts types. On peut utiliser ces écarts types pour établir des intervalles de 
confiance pour les vrais coefficients d'autocorrélation ou des bornes pour les coefficients 
d'autocorrélation empiriques, à l’intérieur desquelles on ne rejette pas l'hypothèse que les 
vrais coefficients correspondants sont nuls. 


1.(—L#) =12 Lt Lt+ (14 =1—-Lt—-1t+15) 
2. On obtient les autocorrélations empiriques, qui sont les valeurs estimées des autocorrélations théoriques po, 
en appliquant sur les données observées la formule de l’estimateur rs de po. 
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Le coefficient d’autocorrélation (simple) empirique d’ordre l'est calculé par : 


D ua Er — À) (mr À) 
>) 


Pour chaque retard /, le coefficient r; d’autocorrélation empirique d’ordre l est un estima- 
teur du vrai coefficient d’autocorrélation de population p,. Une estimation approximative 


" = (5.42) 


1 1-1 
de l'écart type de l’estimateur r, est donnée par la formule | - (: +2 De | 1) pour 
n = 


n 
1 = 1,2...—, qui utilise une approximation de Bartlett (1946), citée par Kendall [KEN 
1983]. Cette formule est utilisée entre autres par le logiciel Microfit [PES 1997]. 


Pour tester l'hypothèse que les p premiers coefficients d’autocorrélation de population 
pr d’une série temporelle sont nuls, on peut utiliser le test Q d’ordre p de Box et Pierce, 
Q(p) =n > : rm) qui est distribué asymptotiquement (donc approximativement pour 
= 
un petit échantillon) selon une Chi-2 à 2 degrés de liberté si l'hypothèse est vraie, ou la 
2 
A . p r; : 
statistique Q* d’ordre p de Ljung et Box [LJU 1978], Q*(p) = n(n +2) d. : G—j qui 
JL (n — 


est aussi distribué asymptotiquement selon une Chi-2 à p degrés de liberté si l’hypothèse est 
vraie. Les deux tests sont équivalents asymptotiquement, mais celui de Ljung et Box est 
meilleur pour de petits échantillons [HAR 1981] [KEN 1983] [PES 1997]. 


Si la série originale est soumise à des fluctuations saisonnières, il est souvent nécessaire 
de les modéliser explicitement dans la spécification, au même titre que la différenciation 
saisonnière évoquée précédemment. 


3.3 ESTIMATION ET VALIDATION DU MODÈLE, ET EXTRAPOLATIONS 
SUR LA BASE DU MODÈLE ESTIMÉ 


On estime les coefficients « vrais inconnus » du modèle choisi à l’aide d’une technique 
algorithmique pour maximiser la fonction de vraisemblance [BOX 1976]. Il faut vérifier 
que le modèle choisi, qui vient d’être estimé, est approprié. S’il est une description 
convenable du vrai processus stochastique dont la série observée est une réalisation, 
le terme d’erreur devrait être un bruit blanc, en d’autres termes il ne devrait pas être 
autocorrélé. 


En cas d’autocorrélation, le modèle n’est pas approprié. Il faut alors en choisir un nouveau, 
l’estimer et le valider. Il est parfois nécessaire de réaliser plusieurs essais avant de trouver 
le «bon candidat ». 


Après cette étape, on peut utiliser le modèle estimé pour élaborer des extrapolations. Si, 
par exemple, il est de type AR(2) : 


e = + Gi X+-1 + D2Xr 2 +e (5.43) 
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et qu’on l’a estimé sur les périodes f allant de 1 à n, on peut calculer des prévisions de X a 


sur les périodes postérieures à n de la manière suivante : 


X un =h+ ® x, + QaXn1 


Bien entendu, les extrapolations X ont une imprécision potentielle qui s’explique ainsi : 
+ D'une part, le modèle utilisé ne décrit pas toute l’évolution de X, donc de la variance 
de #, qui est le terme d’erreur non prévisible. 


+ D'autre part, on ne connaît pas les vraies valeurs des coefficients |1, @1 et @ qu'on 
a remplacés par des estimateurs qui sont eux-mêmes imprécis : ils ont une variance 
strictement positive. 


En utilisant la définition de X en fonction de X, on peut alorstransformer les extrapolations 


X de X en extrapolations X de X. 


Résumé 


Les séries temporelles observées sont des réalisations de processus stochas- 
tiques. Un processus stochastique peut être stationnaire, sous certaines condi- 
tions, ou non stationnaire avec une tendance déterministe uniquement ou avec 
une tendance stochastique (on dit alors que le processus a une racine unitaire, 
ou qu’il est intégré). Les tests de racine unitaire vérifient l’hypothèse de racine 
unitaire, contre l'hypothèse de stationnarité ou denon-stationnarité à tendance 
déterministe uniquement. La classification des processus est importante en 
pratique : en effet, si l’on veut étudier une relation entre plusieurs variables 
(processus), le type de méthode d’inférence statistique à utiliser dépend des 
propriétés de ces processus. Les tests de racine unitaire permettent également 
de déterminer une transformation stationnaire d’une série non stationnaire. 
C’est cette transformation stationnaire qu’il faut utiliser lorsqu'on veut spé- 
cifier et estimer un modèle de type ARMA. Un modèle ARMA appliqué à 
une transformation stationnaire d’un processus intégré s'appelle un modèle 
ARIMA. 
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Problèmes 
et exercices 


EXERCICE | 


EFFICIENCE D'UN MARCHÉ BOURSIER 


Énoncé 


Vérifiez l'efficience du marché boursier américain, en utilisant les données journalières 
du 1/1/1998 au 20/12/2000 (775 observations) issues de l’indice boursier Standard and 
Poors 500 (SP500). Elles sont disponibles dans le fichier SPxls, téléchargeable sur le site 
Internet afférent à ce livre. Travaillez avec TSP. 


Sous certaines conditions, tester l'efficience d’un marché boursier () revient à tester 
l'hypothèse que lindice boursier correspondant a une racine unitaire. Pour comprendre 
cela, il est nécessaire de connaître les principes suivants de la théorie financière : 


+ En finance, la valeur des actions (ce qu’un investisseur rationnel est prêt à payer pour 
les acheter) est égale à la somme des valeurs actualisées des bénéfices futurs anticipés 
de toutes les périodes futures. 


+ Les prix des actions changent donc d’une période à l’autre, en fonction des révisions 
des anticipations sur les bénéfices futurs. 


+ Si le marché boursier est efficient, les investisseurs utilisent immédiatement toute 
l'information disponible pour former leurs anticipations. 


De ces principes, on déduit qu'un marché boursier est efficient quand les critères suivants 
sont satisfaits : 


+ Les prix des actions à la période f et à la période f — 1 diffèrent uniquement parce qu’une 
nouvelle information, imprévisible en { — 1, est arrivée en f, provoquant un changement 
des anticipations de bénéfices, et donc un changement des prix des actions. 


+ La variation d’un indice boursier à la période f (par rapport à son niveau en f — 1) 
est imprévisible à la période f — 1 et aux périodes précédentes. En effet, cette variation 
résulte d’un flux d’une information nouvelle imprévisible auparavant. 


+ Le logarithme d’un indice boursier X est une « marche aléatoire » ou « marche au 
hasard » : 
n(X) = n(Xse 1) +w 


où u;, est un bruit blanc. L'indice boursier X a ainsi une racine unitaire. Un bruit blanc 
n'étant pas corrélé avec son passé, il représente bien mathématiquement un flux d’une 
information imprévisible. Cette formulation implique que la variation (logarithmique) 
de l'indice boursier X à la période t est imprévisible aux dates précédentes : In(X,) — 
M(X;_1) = w, où u, est imprévisible par définition puisqu'il s’agit d’un bruit blanc. 


1. Le lecteur souhaitant davantage d’informations sur ces notions financières peut se procurer l'ouvrage Finance 
de André Farber et al., paru dans la même collection, aux éditions Pearson Education France. Le lecteur peut 
également se reporter à l’ouvrage Gestion de portefeuille, 1997, 3° éd., de C. Broquet, R. Cobbaut, R. Gillet 
et À. Van Den Berg, dans la collection Comptabilité, contrôle & finance, aux éditions de Boeck. La quatrième 
édition de cet ouvrage sortira à l'automne 2004. 
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Vérifier l’efficience d’un marché boursier revient donc à vérifier que l’indice boursier (ou 
son logarithme) est bien représenté par un modèle autorégressif avec p — 1 = 0, et que ce 
modèle a une racine unitaire. 


Il faut ensuite utiliser le test de racine unitaire de Dickey et Fuller. 


Si l’on représente graphiquement l’indice boursier SP500 en fonction du temps, on observe 
qu’il tend à augmenter nettement au cours des périodes considérées. Cela implique que son 
logarithme fait de même. On va tester l'hypothèse que ce logarithme a une racine unitaire 
avec dérive, contre l’hypothèse qu’il est non stationnaire avec tendance déterministe 
uniquement. 


Il faut estimer des modèles autorégressifs avec tendance pour In(SP500,), pour différentes 
valeurs de p — 1, allant de 0 à 10: 

In(SP500,) — In(SP500,_1) = 11 + (p — 1) In(SP500,_1) 

+'\(In(SP500,_1) — In(SP500:_2)) 

+ \(In(SP500;_2) — In(SP500,_:)) 

++ pi (In(SP500,-,+1) — In(SP500,_,)) + Bt + u 


Il faut ensuite sélectionner le « bon » p — 1. Pour le modèle correspondant à la valeur de 
bp — 1 retenue, on compare t. à la valeur critique à 0,5 % de la table spéciale de Dickey 
et Fuller, ou on regarde la probabilité critique. On détermine alors si l’on rejette ou pas 
l'hypothèse de racine unitaire pour In(SP500;). Si le bon p — 1 vaut 0 et si l’on ne rejette 
pas hypothèse de racine unitaire, le marché est efficient. 


On commence par mettre les données dans un format Excel lisible par TSP (voir chapitres 2 
et 3), en procédant de la manière suivante : 


+ On place les valeurs successives de l’indice boursier en première colonne avec le nom 
de cette variable en première ligne. 


+ On enregistre le fichier sous le nom SP.XLS, dans le dossier C:\ du disque dur, au format 
Feuille de calcul Excel (peu importe la version). 


Si l’on veut réaliser le test de racine unitaire manuellement, les instructions TSP nécessaires 
sont les suivantes : 


freq n; 

smpl FA AS: 

read(file=*c :\sp.xls’); 
sp=log(sp): 

smpl 2 775; 
disp=lsp-lsp(-1); 

trend t:; 
regopt(pvprint,stars) all; 
noplot; 
supres vCcov vcor; 

smpl 12 775; 

olsq disp c t 1sp(-1); 
cdf(dickeyf,constant,trend 
olsq disp c t Isp(-1) disp 
cdf(dickeyf,constant,trend 
olsq disp c t Isp(-1) disp 


@t(3); 

<l): 

@t(3); 

-1) disp(-2); 


HR 


Tests de racine unitaire et modèles ARIMA 


175 


176 


cdf(dickeyf,constant,trend) @t(3); 
olsq disp c t Isp(-1) disp(-1)-d1sp(-3);: 
cdf(dickeyf,constant,trend) @t(3);: 
olsq disp c t Isp(-1) dlisp(-1)-d1sp(-4); 
cdf(dickeyf,constant,trend) @t(3); 
olsq disp c t Isp(-1) disp(-1)-d1sp(-5);: 
cdf(dickeyf,constant,trend) @t(3);: 
olsq disp c t Isp(-1) disp(-1)-d1sp(-6);: 
cdf(dickeyf,constant,trend) @t(3); 
olsq disp c t Isp(-1) disp(-1)-dlsp(-7); 
cdf(dickeyf,constant,trend) @t(3); 
olsq disp c t Isp(-1) disp(-1)-d1sp(-8);: 
cdf(dickeyf,constant,trend) @t(3); 
olsq disp c t Isp(-1) disp(-1)-d1sp(-9); 
cdf(dickeyf,constant,trend) @t(3);: 
olsq disp c t Isp(-1) disp(-1)-d1sp(-10); 
cdf(dickeyf,constant,trend) @t(3); 


On estime donc des modèles autorégressifs pour toutes les valeurs de p — 1 allant de 0 
à 10, sur un même échantillon de données, et l’on teste à chaque fois l’hypothèse de racine 
unitaire. Les résultats de l’estimation du modèle où p — 1 = 0 sont les suivants : 


Mean of dependent variable = .373549E-03 
Std. dev. of dependent var. = .012576 
Sum of squared residuals = .119479 
Variance of residuals = .157003E-03 
Std. error of regression = .012530 
R-squared = .996590F-02 
Adjusted R-squared = ./736397E-02 
Durbin-Watson statistic = 1.97463 
ARCH test = 14,2224 xx [,000] 
CuSum test = .717518 [.226] 
CuSumSq test = .106228 xx [,000] 
Chow test = 1.63542 [.178] 
LR het. test (w/ Chow) = 2.52054 [C.112] 
White het. test = 54.2136 ** [.000] 
Jarque-Bera normality test = 228.336 ** [.000] 
F-statistic (zero slopes) = 3.83020 * [.022] 
Akaiîike Information Crit. = -5.91745 
Schwarz Bayes. Info. Crit. = -8.73711 
Log of likelihood function = 2263.47 
Estimated Standard 


Variable Coefficient Error Ces ta tiSiTé P-value 

C .129683 .055094 2.35385 * [.018] 

T .608486E-05 .444691E-05 1.36833 [.168] 

LSP:C=1) -.018420 .792105E-02 2,82 b4l * [.019]JDICKEY-FULLER(CT,ASY.,1) 


Test Statistic : -2.325414, Lower tail area : .41995 


On commence par examiner les propriétés du terme d’erreur, en utilisant les tests habituels 
(voir chapitre 2). Ils révèlent une hétéroscédasticité (soit un rejet de l'hypothèse d'absence 
d’hétéroscédasticité) de type ARCH, qui induit le rejet de l'hypothèse de normalité du 
terme d’erreur : un processus ARCH a en effet une distribution conditionnelle normale, 
mais une distribution inconditionnelle (marginale) qui ne l’est pas (voir chapitre 7). 
L'examen des résultats des dix autres modèles (pour p — 1 allant de 1 à 10) montre que le 
problème d’hétéroscédasticité persiste quelle que soit la valeur de p — 1. 
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Si l’on néglige cette propriété, on constate l'absence d’autocorrélation du terme d’erreur 
pour tous les modèles, même celui où p — 1 = 0. Ce résultat suggère qu’on pourrait se 
baser sur le modèle où p — 1 = 0, ce qui est validé, entre autres, par Les résultats suivants 
(relatifs à l’estimation du modèle où p — 1 = 10) : on ne rejette l'hypothèse de nullité 
pour aucun coefficient des variations retardées (voir les chapitres 2 et 3 à propos de ce 
test). 


Mean of dependent variable = .3/73549E-03 
Std. dev. of dependent var. = .012576 
Sum of squared residuals = .11/838 
Variance of residuals = .156908E-03 
Std. error of regression = .012526 
R-squared = .023568 
Adjusted R-squared = ./96612E-02 
Durbin-Watson statistic = 1.98625 
Durbin’s h alternative = 1.19625 T.232] 
ARCH test = 11.8410 ** [.001] 
CuSum test = .513407 [.609] 
CuSumSq test = .100406 ** [.001] 
Chow test = 1.28459 [.216] 
LR het. test (w/ Chow) = 4.06849 %* [.044] 
White het. test = 206.126 ** [.000] 
Jarque-Bera normality test = 245.995 xx [000] 


F-statistic (zero slopes) = 1.51058 [.115] 
Akaike Information Crit. = -5.90511 
Schwarz Bayes. Info. Crit. = -8.66406 


Log of likelihood function = 2268.75 


Estimated Standard 


Variable Coefficient Error t-statistic P-value 

C .097357 .058620 1.66082 [.093] 

T .325612E-05 .478638E-05 .680290 [.504] 

LSP(-1) -.013730 .843741E-02 -1.62726 [.100] 

DLSP(-1) .127001E-02 .037068 .034262 [.923] 

DLSP(-2) -.020995 .036935 -.568435 [.577] 

DLSP(-3) -.068649 .036919 -1.85943 [.060] 

DLSP(-4) .011343 .036940 .307074 C./53] 

DLSP(-5) .948036E-02 .036751 .257961 [./85] 

DLSP(-6) -.038645 .036744 -1.05175 [.294] 

DLSP(-7) -.059663 .036773 -1.62247 [.101] 

DLSP(-8) -.013601 .036655 -.3/1068 [./10] 

DLSP(-9) -.061451 .036695 -1.6/463 [.090] 

DLSP(-10) .023970 .036752 .652212 [.522] 
DICKEY-FULLER(CT,ASY.,1) Test Statistic: -1.62/7259, Lower tail area: ./78158 

Un test du rapport de vraisemblance (voir chapitre 3) plaide également en faveur de la 


possibilité évoquée précédemment : il montre que le modèle où p — 1 = 0 n’est pas 
rejeté, par rapport au modèle où p — 1 = 10, puisque 10.56 (= 2(2268.75 — 2263.47)) est 
inférieur à la valeur critique au seuil 0,05 d’une distribution Chi-2 à 10 degrés de liberté. 
La valeur de t. pour le modèle où p — 1 = 0 est alors —2.32541. La probabilité critique 
du test (lower tail area) est égale à 0.41995, qui est supérieur à 0.05. On ne rejette donc 
pas l’hypothèse de racine unitaire pour In(SP500). Puisque, en même temps, p — 1 = 0, 
on en conclut que le marché boursier américain est efficient. 
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On obtient un résumé de ces résultats en écrivant un programme qui n’utilise que la 


commande automatique COINT de TSP : 


freq n; 
smpl 1 


LAS 


read(file=*C :\sp.x1s’); 


1sp=10g 


(Sp); 


coint(df,nows,nopp,const,trend,maxlag=10) 1sp; 


Les résultats sont les suivants : 


Dickey-Fuller (tau) test 


um lags 0 l 2 3 4 
alpha 0.98158 0.98138 0.98181 0.98353 0.98312 
TestStat -2.32541 -2.32989 2 264:0 1. -2.03202 -2.07075 
P-value 0.419985 0.41749 0.45738 0.58389 0.56243 
Const 0.12974 0.13110 0.12813 0.11626 0.11914 
t(Const) 2.35328 2.35761 2.28605 2.06208 2.10034 
Trend 6.08486D-06 6.20155D-06 5.94515D-06 4.89839D-06 5.16161D-06 
t(Trend) 1.36833 1.38119 1.31224 1.07337 1.12247 

um obs 764.00000 764.00000 764.00000 764.00000 764.00000 
LogLike 2263.46599 2263.48499 2263.58110 2265.12849 2265.24554 
AIC -5.91745 -5.91488 #5:,91252 <5591395 -5.91164 
Var res 0.00015700 0.00015720 0.00015737 0.00015694 0.00015710 

um lags 5 6 7 8 9 
alpha 0.98276 0.98354 0.98496 0.98528 0.98684 
TestStat -2.09996 -1.99268 -1.81247 -1.7/6351 -1.56881 
P-value 0.54612 0.60542 0.69871 0./2208 0.80441 
Const 0.12157 0.11620 0.10641 0.10424 0.093473 
t(Const) 2.12920 2.02272 1.84407 1./9543 1.602427 
Trend 5.37508D-06 4.90823D-06 4.04932D-06 3.8568/D-06 2.89660D-06 
t(Trend) 1.16009 1.05188 0.86316 0.81635 0.60946 

um obs 764.00000 764.00000 764.00000 764.00000 764.00000 
LogLike 2265.32271 2265.69310 2267.01837 2267.08365 2268.53446 
AIC -5.90922 -5.90757 -5.90843 -5.90598 -5.90716 
Var res 0.00015727 0.00015733 0.00015699 0.00015718 0.00015679 

um lags 10 Opt:2 
alpha 0.98627 0.98341 
TestStat -1.62726 -2.08405 

P-value 0./8158 0.655502 
Const 0.097390 0.11674 
t(Const) 1.66016 2.10928 
Trend 3.25612D-06 5.6/7700D-06 
t(Trend) 0.68029 1525352 

um obs 764.00000 772.00000 
LogLike 2268./75077 2285.75739 
AIC E5a906TT -5.90870 
Var res 0.00015691 0.00015798 


Les résultats des tests de racine unitaire pour chaque valeur de p — 1 sont les mêmes que 
précédemment. TSP propose automatiquement le modèle correspondant à la valeur de 
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p — 1 qui maximise le critère AIC2, en l'occurrence p — 1 = 2 (qui contredit l’hypothèse 
d’efficience du marché boursier), alors que la méthode précédente suggère le choix de 
p — 1 = 0. Les différents critères proposés pour faire le choix de p — 1 donnent souvent 
des résultats différents. 


EXERCICE 2  STRUCTURE PAR TERMES DES TAUX D'INTÉRÊT 


Énoncé 


Le différentiel entre les taux d’intérêt à long et à court terme, en données trimestrielles, 
a-t-il une racine unitaire? 

Pour répondre à cette question, vous disposez, dans le fichier SPREAD xls téléchargeable 
sur le site afférent à ce livre, des données de ce différentiel, appelé SPREAD, pour le 
Royaume-Uni, du deuxième trimestre 1952 au quatrième trimestre 1988. 

Selon la théorie de la structure par termes des taux d’intérêt, l’écart entre taux longs et 
courts dépend des anticipations de la valeur des taux courts futurs et d’une prime de risque. 
À prime de risque constante, les changements de ce différentiel, d’une période à l’autre, 
ne dépendent que des révisions des anticipations des taux courts. Si les anticipations 
sont rationnelles, les révisions sont imprévisibles. Le différentiel d’une période est alors 
égal au différentiel de la période précédente, augmenté d’un terme aléatoire qui n’est 
pas lié à son passé, et qui représente le flux de nouvelle information arrivée durant la 
période considérée. Sous l’hypothèse d’anticipations rationnelles, la théorie financière de 
la structure par termes des taux d’intérêt implique donc que le différentiel de taux doit 
avoir une racine unitaire. Vérifiez ce point en utilisant les tests de Dickey et Fuller. 


Un examen de la série SPREAD sous EXCEL ou TSP suggère une moyenne relativement 
stable dans le temps. On réalise donc des tests DF et ADF avec constante et sans tendance, 
de la façon suivante : 


+ D’une part, on applique une procédure manuelle pour les tests DF, ADF(1) et ADF(2) : 
pour plusieurs valeurs successives de p — 1 allant de 0 à 2, on estime l’équation AR(p) 
reparamétrée, on récupère 1, et l’on compare cette valeur à la table spéciale de Dickey 
et Fuller. 


+ D'autre part, on applique une procédure automatique appelée COINT, pour les tests DF 
et ADF(1) à ADF(10). 

Le fichier SPREAD doit se présenter sous une forme lisible par TSP. On suppose qu’il 

se trouve dans le répertoire C: de l’ordinateur. Le programme d’instructions TSP est le 

suivant : 


freq q; 

smpl 52 :1 88 :4; 

read(file="uk.wks”); 

smpl 52 :2 88 :4; 
dspread=spread-spread(-1); 

? 

? DF sur l'échantillon maximal pour un DF 
? 


olsq dspread c spread(-1); 
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cdf(dickeyf,notrend) @t(2); 
? 


? DF sur l’échantillon maximal permettant aussi un ADF(10) 
? 

smpl 54 :4 88 :4; 

olsq dspread c spread(-1); 

cdf(dickeyf,notrend) @t(2); ? 

o 


ADF(1) sur l'échantillon maximal pour un ADF(1) 


smpl 52 :3 88 :4; 
olsq dspread c spread(-1) dspread(-1); 

cdf(dickeyf,notrend) @t(2); ? 

? ADF(1) sur l'échantillon maximal permettant aussi un ADF(10) 


smpl 54 :4 88 :4; 
olsq dspread c spread(-1) dspread(-1); 


cdf(dickeyf,notrend,) @t(2); ? 
? 


ADF(2) sur l’échantillon maximal pour un ADF(1) 
? 
smpl 52 :4 88 :4; 
olsq dspread c spread(-1) dspread(-1) dspread(-2); 
cdf(dickeyf,notrend) @t(2); ? 
? 
ADF(2) sur l’échantillon maximal permettant aussi un ADF(10) 
? 
smpl 54 :4 88 :4; 
olsq dspread c spread(-1) dspread(-1) dspread(-2); 


cdf(dickeyf,notrend,) @t(2); ? 
? 


Procedure automatique pour DF et ADF(1) jusqu’à ADF(10) sans tendance 
? 

smpl 52 :1 88 :4; 

coint(df,nows ,const,notrend,maxlag=10) spread:; 


Quand on réalise un test ADF(p — 1), on perd les p premières observations. On peut donc 
opérer les tests ADF(p — 1) sur un échantillon maximal, différent pour chaque valeur 
de p, ou sur le même échantillon, en l’occurrence le plus grand permettant de réaliser les 
tests. Dans ce cas, on perd p* observations, où p* est la plus grande valeur de p envisagé 
(11 si lon va jusqu’à un ADF(— 10)). 

Dans le programme, SPREAD correspond à X;, DSPREAD à X; — X;_1, DSPREAD(-1) à 
X;_1 —X, 2... La variable SPREAD(-1) correspond à X,_1. 


ty est la t-stat du coefficient SPREAD(-1). Après chaque estimation par MCO, TSP 
récupère le vecteur des t-stat des coefficients dans un vecteur @T. La t-stat de SPREAD(-1), 
tu, est donc le deuxième élément de @T, soit @T(2). 


L'instruction cdf compare t,,, c’est-à-dire @T(2), à la table de distribution spéciale de 
Dickey et Fuller (dickeyf), valable en l’absence de tendance (notrend).TSP donne alors 
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la probabilité critique : le pourcentage de distribution qui reste à gauche de 1. Si cette 
valeur est inférieure à 0,05, on rejette l'hypothèse de racine unitaire. 


Le test DF fournit les résultats suivants si le modèle AR(1) correspondant (avec p — 1 = 0) 
est estimé sur l'échantillon permettant la comparaison avec les autres modèles : 


Equation 2 
Method of estimation = Ordinary Least Squares 


Dependent variable: DSPREAD 
Current sample: 1954:4 to 1988:4 
Number of observations: 137 


Mean of dep. var. = -.029635 LM het. test = .63818/7 [.424] 
Std. dev. of dep. var. = .922748 Durbin-Watson = 1.83631 [.148,.654] 
Sum of squared residuals = 108.663 Jarque-Bera test = 12.4303 [.002] 
Variance of residuals = .804913 Ramsey’s RESET2 = .100353 [.7/752] 
Std. error of regression = .897170 F (zero slopes) = 8.86526 [.003] 
R-squared = .061622 Schwarz B.I.C. = -.159902 
Adjusted R-squared = .054671 Log likelïhood = -178.521 
Estimated Standard 
Variable Coefficient Error t-statistic P-value 
C .1/3571 .102631 1.69122 [.093] 
SPREAD(-1) -.139699 .046919 -2.97746 [.003] 


DICKEY-FULLER(C,ASY.,0) Test Statistic: -2.97/7459, Lower tail area: .03705 


L'instruction de la procédure automatique pour réaliser des tests DF, ADF(1)... ADF(10) 
est coint(df,nows,const,notrend,maxlag=10), où df appelle le test de Dickey et 
Fuller, nows exclut le test White Symetric, const exige la présence d’une constante 11 
dans le modèle AR(p) reparamétré, notrend exclut une tendance dans le modèle AR(p) 
reparamétré, etmax1ag=10 commande d’aller jusqu’à un AR(11), donc jusqu'à p—1 = 10. 


En réponse à cette instruction, TSP réalise d’abord les tests DF, ADF(1)... ADF(10) sur 
le plus grand échantillon utilisable. On retrouve les résultats de la procédure manuelle 
pour cet échantillon commun. Dans le tableau de résultats, alpha est ÿ , TestStat est t,, 
p-value est la probabilité critique issue de la comparaison de TestStat à la table spéciale de 
Dickey et Fuller, Const est l’estimation de la constante 11 dans l'AR(p) et (Const) est la 
t-stat de la constante. Dans la première colonne, on retrouve les résultats du test DF réalisé 
manuellement dont le modèle a été estimé sur l’échantillon maximal pour un ADF(10). 


Unit root tests for SPREAD 
Dickey-Fuller (tau) test 

um lags 0 2 3 
alpha 0.86030 0.8471 0.84106 0.83562 
TestStat -2.97746 -3.11624 -3.10162 -3.07089 
P-valAsy 0.037054 0.025375 0.026433 0.028784 
Const 0.17357 0.19419 0.20318 0.21125 
t(Const) 1.69122 1.84804 1.88977 1.91852 
um obs 137.00000 137.00000 137.00000 137.00000 
LogLike 1/8; 52131 -1/8.08534 -1/7.99291 -1/7.92382 
AIC 2.63535 2.64358 2.65683 2.67/7042 
Var res 0.8049T 0.80578 0.81074 0.81606 
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um lags 4 5 6 7 
alpha 0.84065 0.84728 0.8255 0.85808 
TestStat -2.84534 -2.61419 -2.89234 -2.27090 
P-valAsy 0.052083 0.090101 0.046246 0.18152 
Const 0.20368 0.19351 0.22757 0.1/658 
t(Const) 1.80183 1.66775 1.92454 1.46392 

um obs 137.00000 137.00000 137.00000 137.00000 
LogLike -1/77.87120 -1/7.78101 -1/6.78127 -1/5.07283 
AIC 2.684275 2.69753 2.69754 2.68719 
Var res 0.82166 0.82689 0.821722 0.80725 
Num lags 8 9 10 Opt:2 
alpha 0.86690 0.88677 0.89571 0.84142 
TestStat -2.06027 -1.71074 -1.53475 -3.19247 
P-valAsy 0.26079 0.42559 0.51626 0.020425 
Const 0.16244 0.13017 0.11450 0.20620 
t(Const) 1.31487 1.03605 0.89075 1.99185 
Num obs 137.00000 137.00000 137.00000 145.00000 
LogLike -1/74.90320 -1/3.97810 -1/3.77427 -184.32808 
AIC 2.69932 2.700417 2.711203 2.59763 
Var res 0.81160 0.80706 0.81110 0.76533 

Summary of Unit root tests 


TestStat P-value Num.lags 
Dickey-F -3.19247 0.020425 2.00000 


À la colonne opt, TSP sélectionne le meilleur choix de p — 1 par rapport au critère 
AIC2. Il faut donc se fier au 1, calculé pour cette valeur de p — 1. TSP réestime alors 
le modèle AR(p) reparamétré, sur l’échantillon maximal pour cette valeur de p — 1, et 
donne les résultats dans cette colonne. Ici, opt:2 indique que le choix porte sur un ADF(2) 
(p — 1 = 2). Dans le cadre de la procédure manuelle, on obtient les valeurs de cette 
colonne en estimant le modèle de PADF(2) sur l'échantillon maximal pour un ADF(2), 
alors que l’on obtient les valeurs de la colonne 2 en estimant le modèle de l'ADF(2) sur 
Péchantillon maximal pour un ADF(10). 


EXERCICE 3 TAUX D'INTÉRÊT ET RAPPORT DE VARIANCE 


Énoncé 


Utilisez les tests du rapport de variance pour vérifier l'hypothèse que les taux d’intérêt 
à court et à long terme, en France, en données annuelles, ont une racine unitaire. Ces 
données se trouvent dans le fichier Excel ASSUR.XLS. La variable TMM est le taux d'intérêt 
à court terme et la variable OBL est le taux d’intérêt à long terme. Travaillez avec TSP. 


Sur le site Internet de TSP International, téléchargez la procédure TSP vratio, écrite 
par Clint Cummins, qui réalise les tests de rapport de variance. Écrivez un petit pro- 
gramme TSP qui applique cette procédure aux variables TMM et OBL. Vous n’avez que les 
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neuf premières instructions à rédiger vous-même. Pour la suite, recopiez simplement la 
procédure de Clint Cummins. Le programme complet est Le suivant : 
options memory=10; 

options crt; 

freq à; 

smpl 1963 1999; 

read(file=‘assur.xls’); 

title ‘variance ratio tmm’; 

vratio tmm 2 5; 

title ‘variance ratio obl’; 

vratio obl 2 5; 

NSERER ICI LES INSTRUCTIONS DE LA PROCEDURE VRATIO 


Les résultats sont : 


variance ratio tmm 


Q VRHO 2 RHO VRHET %VRHET 
Value 2.00000 0.91415 0.36064 0.49141 0.62313 
Q VRHO 2 RHO VRHET %VRHET 
Value 3.00000 0.22843 0.81931 0.14750 0.88273 
Q VRHO 2 RHO VRHET %VRHET 
Value 4,00000 0.065000 0.94817 0.049636 0.9604 
Q VRHO %\VRHO VRHET %VRHET 
Value 5.00000 -0.089763 0.92847 -0.076080 0.93935 


variance ratio obl 


Q VRHO %\RHO VRHET %\RHET 
Value 2.00000 1.94849 0.051356 1.13000 0.25848 
Q VRHO %\RHO VRHET %\RHET 
Value 3.00000 1.96573 0.049330 1.47526 0.14014 
Q VRHO %\RHO VRHET %\RHET 
Value 4.00000 2.01050 0.044379 1.68581 0.091833 
Q VRHO %\RHO VRHET %\RHET 
Value 5.00000 1.74127 0.081636 1.61398 0.10653 
Pour chaque valeur de i (appelée ici Q) allant de 2 à 5, VRHOM est la probabilité critique 


du test VRHOM et %VRHET est la probabilité critique du test VRHET. Pour TMM et pour OBL, 
ces valeurs critiques sont toujours supérieures à 0,05. On ne rejette donc pas l'hypothèse 
de racine unitaire pour ces deux variables. 
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EXERCICE À TAUX D'INTÉRÊT RÉEL 


Énoncé 


Testez l'hypothèse que le taux d’intérêt réel à long terme en France a une racine unitaire. 
Cette variable, notée OBLR, se trouve dans le fichier ASSUR:.xls, téléchargeable à partir du 
site afférent à ce livre. Appliquez plusieurs tests de racine unitaire préprogrammés dans 
Easyreg pour savoir si le taux d’intérêt réel a une tendance stochastique. Les données sont 
annuelles et vont de 1963 à 1999. 


Préparation et lecture des données 


Ouvrez le fichier ASSUR.xls sous Excel, cliquez sur Fichier puis sur Enregistrer sous, et 
sélectionnez CSV (séparateur point-virgule) comme type de fichier. Laissez Disque local 
C:\ dans la zone Enregistrer dans et conservez ASSUR comme nom de fichier. Cliquez sur 
Enregistrer. 


Le logiciel crée alors un fichier ASSUR:csv dans C:\. Ouvrez Easyreg, puis cliquez suc- 
cessivement sur File/Choose an input file/Choose an Excel file in CSV format. Dans la 
fenêtre Guided tour qui apparaît, cliquez sur la réponse de votre choix; si vous demandez 
le Guided tour, réduisez la fenêtre Guided tour on importing Excel files in CSV format 
pour pouvoir continuer à travailler avec Easyreg (et voir la fenêtre About CSV files). Dans 
la fenêtre About CSV files, cliquez sur Continue. 


Vous accédez à une fenêtre Find a CSV file : sélectionnez Manually dans Search options, 
C: dans Choose drive, et C:\ dans Choose folder/directory. Cochez Double-click to choose 
file and continue. Double-cliquez sur C:\ ASSUR.:csv dans Files found. Vous accédez à la 
fenêtre Data type of the CSV file. Cochez Annual time series, puisque les données sont 
annuelles. Inscrivez 1963 dans Year of first observation et cliquez sur OK. Cliquez sur 
Confirm, puis sur Continue. Vous accédez à Analyzing the CSV file. 


Cliquez sur Code OK. La fenêtre Data written to files s'affiche. Cliquez sur Continue. 
Check the data apparaît. Cliquez sur Continue. La fenêtre About the start-up folder 
EASYREG.DAT apparaît. Cliquez sur Continue. Vous accédez à Choose drive and folder 
to start-up EasyReg : sélectionnez C:\, inscrivez ASSUR dans Make a new sub-folder in the 
Current folder Enter the folder name et cliquez sur OK. Ensuite cliquez sur Start Easyreg 
in current folder. 
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Le graphique de la série OBLR en fonction du temps montre que le niveau moyen du 
taux d’intérêt réel est plus élevé durant les années postérieures à 1980. Cela ne signifie 
pas nécessairement que la série ait une véritable tendance croissante continue. D’un point 
de vue théorique d’ailleurs, il semble illogique qu'un taux d’intérêt réel ait tendance à 
augmenter indéfiniment à long terme. Pour ces raisons, il est difficile d'établir a priori s’il 
faut se fier à des tests de racine unitaire avec constante et tendance (comme le suggère le 
graphique) ou à des tests avec constante et sans tendance (ce que suggère le raisonnement 
économique). Vous allez donc faire les deux. 


Pour accéder au menu des tests de racine unitaire, cliquez successivement sur Menu/Data 
analysis/Unit root tests (root1). La fenêtre Select time series to be tested for unit root 
s'affiche. Double-cliquez sur OBLR et cliquez sur Selection OK. Dans la fenêtre qui 
apparaît, répondez NO à la question « Do you want to use a subset of observations? ». 
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Cliquez sur Continue. Unit root and stationarity tests s'affiche. Cliquez sur ADF pour 
réaliser des tests de Dickey et Fuller. La fenêtre Augmented Dickey Fuller ADF unit root 
tests apparaît. Cliquez sur ADF2 pour réaliser le test sans tendance (1, ). Le logiciel affiche : 


Augmented Dickey-Fuller (ADF) test 2. 
Auxiliary model: 
ZÉD)r ACTE) AL ZT EL) TE DO ECZLELE IE Z CTI 60 

+ b(p).(z(t-p)-z(t-p-1)) + b(p+1) + uCE), 

LS pre n, where u(t) is white noise. 

Notice: b(p+1) is the intercept. 

Null hypothesis-H(0): 

z(t) is a unit root process: à = 0. 

Alternative hypothesis CHI): 

zZ(t) is stationary process: à < 0. 

The test statistic is the t-value of a. 

The default lag width is p = [cn'r], where: 

c = 5 and r = .25. 

References: 

Fuller, W.A. (1996) : Introduction to Statistical Time Series 

(2nd Ed.). New York: John Wiley 

Said, S.E. and D.A.Dickey (1984): Testing for Unit Roots in 
Autoregresive Moving Average of Unknown Order. Biometrika 71, 599-607 
Said, S.E. (1991): Unit Root Test for Time Series Data with a Linear 
Time Trend. Journal of Econometrics 47, 285-303 

Warning: 

This test may have low power against linear trend stationarity! 


Puisque vous disposez de trente-sept observations, le logiciel propose un test ADF(p) où 

p = (0,5)37%% — 12, Cliquez sur Use this p pour choisir cette valeur de p. Attention : 

ce que Easyreg appelle p correspond au p — 1 de la partie théorique de ce chapitre et des 
exercices précédents. Cliquez ensuite sur Conduct test. Le logiciel affiche un long texte | 
présentant d’abord les éléments fournis précédemment, puis la partie suivante : 


Dr 12 = lé:ntr ls whére e=5:. r=:26.-n1=37 

Variable to be tested: 

z(t) = oblr 

HO: Unit root with drift; H1l: Linear trend stationarity 
ADF model for z(t)-z(t-1) 


OLS estimate t-value Asymptotic critical regions: 
Zz(t= TL) -0.3965 -2.5426 < -2.89 (5%) 

< -2.58 (10%) 

p-value = 0.11000 


zZ(t-1)-2z(t-2) -0.2449 -1.0032 
z(t-2)-z(t-3) -0.0569 -0.2915 
z(t-3)-z(t-4) -0.0708 -0.4444 
z(t-4)-z(t-5) 0.0831 0.4729 
z(t-5)-z(t-6) 0.4655 2.7204 
z(t-6)-z(t-7) 0.4941 2.4726 
z(t-7)-z(t-8) 0.1756 0.8725 
z(t-8)-z(t-9) 0.1520 0.7863 
z(t-9)-z(t-10) 0.1100 0.5548 
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z(t-10)-z(t-11) -0.1306 -0.7205 
Z(LAET)=ZCES- 12) SO: 145 =0:/119 
ZCEET2)=ZCE 13%  <0:1494 -0.7294 
1 1.8743 3.2313 
Residual S.e.: 88./7997/76E-002 
R-square: 0.69849 

n: 24 

Test result: 


HO is not rejected at the 10% significance level 


Wald test that the lag width can be reduced from 12 to q: 
q Chi-square test d.f. 5% crit. value 10% crit. value p-value 


11 0.532 1 3.841 2.705 0.46575 
10 0.866 2 5.991 4.605 0.64840 
9 .148 3 7.815 6.251 0./6558 
8 2.442 4 9.488 7.780 0.65508 
7 E:833 5 1.071 9.237 0.57364 
6 4.175 6 2359 0.645 0.65294 
5 8.115 7 4.067 2.017 0.32254 
4 14.467 8 5.507 3.361 0.070377 (*) 
8 14.641 9 6.919 4.683 0.10128 
2 14.921 10 8.307 5.987 0.13496 
1 15.410 11 9.675 RAR 0.16447 
0 15.480 12 21.026 8.549 0.21622 
(*) -» significant at the 10% level 
Selection of p under the null hypothesis by 
the Akaïke (AC), Hannan-Quinn (HQ), and Schwarz (SC) 
information criteria 
P AC HQ SC 
0.45644  0.47178  0.60246 
2 0.56751 0.59813 0.86472 
3 0.65526  0.7/70103 1.10917 
4 0./8883 0.84957 1.40527 
5 0.82065  0.89604 1.60581 
6 0.92069 .01035 1.88117 
7 1.05599 .15936  2.19883 
8 1.21533 .33169 2.54802 
9 1.39044 .51888 2.92100 
10 1.38759 .52693 3.12459 
11 1.11998 .26873  3.07259 
12 1.34935 .50561 3.52740 
Optimal p: 1 1 
WARNING: Number of parameters in the ADF model exceeds half the number 
of observations. 


Ces résultats donnent un test ADF(12). p — 1 = —0.3965 et t, = —2.5426. Cette valeur 
est supérieure à la valeur critique, qui est —2.99. L'hypothèse p = 1 n’est donc pas rejetée, 
ce que confirme la probabilité critique de ce test, qui est de 0.11000, soit une valeur 
supérieure à 0.05. La question qui se pose est la suivante : faut-il se fier à un ADF(12) 
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ou bien choisir un autre retard p dans l’équation de base? Le deuxième tableau (Wald = 
test...) permet de répondre à cette question. Quand g vaut 11, la ligne correspond à un 
test de l'hypothèse que le coefficient de la douzième variation retardée est nul (et donc 
qu'un AR(11) suffit). Quand g vaut 10, la ligne correspond à un test de l’hypothèse que 
les coefficients des onzième et douzième variations retardées sont nuls (et donc qu'un 
ADF(10) suffit), et ainsi de suite. Quand g vaut 0, le test porte sur l'hypothèse que les 
coefficients de la première à la douzième variations retardées sont tous nuls. Tous ces 
tests, sauf un, sont inférieurs à leurs valeurs critiques au seuil de 10% de 5 %, puisque 
leurs probabilités critiques sont supérieures à 0,05. Leurs hypothèses nulles respectives ne 
sont donc pas rejetées, en particulier hypothèse qu’il est possible de réduire p — 12 à 
p = 0, c’est-à-dire qu’un test DF suffit (1). I] faut donc refaire le test en choisissant p = 0. 
Pour cela, cliquez sur Done. La fenêtre Simulation of the actual p value of the ADF test 2 
s'affiche : cliquez sur NO. Unit root and stationarity tests apparaît : cliquez sur ADF. 
Dans la fenêtre suivante, cliquez sur ADF2. Dans la fenêtre suivante, cliquez sur Choose 
another p. Ensuite, dans Enter p, saisissez 0 et cliquez sur Conduct test. Les résultats sont 
les suivants : 


p =0 
Variable to be tested: 
z(t) = oblr 


HO: Unit root with drift; H1: Linear trend stationarity 
ADF model for z(t)-z(t-1): 


OLS estimate t-value Asymptotic critical regions: 
AT) -0.1428 -1.7236 < -2.89 (5%) 
< -2.58 (10%) 
p-value = 0.41000 


1 0.5918 1.6661 
Residual $s.e.: 12.07/081FE-001 
R-square: 0.08036 

n: 36 


Test result: 
HO is not rejected at the 10% significance level 


L'hypothèse de racine unitaire pour le taux d’intérêt réel OBLR n’est pas rejetée. Cliquez 
sur Done, puis sur NO dans la fenêtre suivante. Unit root and stationarity tests apparaît. 
Cliquez sur ADF, puis sur ADF3 pour réaliser un test de Dickey et Fuller avec constante et 
tendance. Dans la fenêtre suivante, cliquez sur Choose another p. Ensuite, dans la fenêtre 
Enter p, saisissez 0 et cliquez sur Conduct test. Les résultats sont les suivants : 


Augmented Dickey-Fuller (ADF) test 3 
Auxiliary model: 
zZ(t)-z(t-1) = a.z(t-1) + b(1).(ZCt-1)-Z(t-2)) + ... 
+ b(p).(z(t-p)-z(t-p-1)) + b(p+1) + b(p+2).t + u(t), 
t = p+2,...,n, where u(t) is white noise. 

Null hypothesis H(O): 

z(t) is a unit root with drift process: à = 0. 


1. Le troisième tableau compare quelques critères usuels d’ajustement statistique pour les valeurs de p allant 
de 0 à 12. Ici c’est plutôt p = 1, donc un ADF(1), qui donne les meilleurs critères. 
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Alternative hypothesis H1: 
z(t) is à trend stationary p 
The test statistic is the t- 


rocess: à < 0. 
value of à. 


The default lag width is p = [cn'r], where 
c = 5 and r = .25. 
References: 
Fuller, W.A. (1996): Introduction to Statistical Time Series 
(2nd Ed.). New York : John Wiley 
Said, S.E. and D.A.Dickey (1984): Testing for Unit Roots in Auto- 
regresive Moving Average of Unknown Order. Biometrika 7/1, 599-607 
Said, S.E. (1991): Unit Root Test for Time Series Data with a 
Linear Time Trend. Journal of Econometrics 47, 285-303 
Time series to be tested for a unit root: 
oblr 
Available observations: t = 1(=1963),...,3/7(—1999) 
=Chosen 
p =0 
Variable to be tested: z(t) = oblr 
HO: Unit root with drift; H1l: Linear trend stationarity 
ADF model for z(t)-z(t-1) 
z(t-1) OLS estimate t-value Critical regions: (*) 
-0.1869 -1.7677 < -3.6 (5%) 
€ -3.24 (10%) 
p-value = 0.72000 
1 0.4198 0.9579 
t 0.0168 0.6803 
Residual S.e.: 12.16/732E-001 
R-square: 0.09307 
n: 36 


(*) See Fuller (1996), Table 


Test result: 
HO is not rejected at the 10 


10.A.2., p.642 


% Significance level 


L'hypothèse de racine unitaire pour le taux d’intérêt réel OBLR n’est pas rejetée. Comme 
la t-stat de la tendance t est très faible, son coefficient n’est pas significatif. Conclusion : 
c’est plutôt le test ADF 2 qui est pertinent (voir figure 5.1). 


Figure 5.1 
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Cela dit, les tests ADF 2 et ADF 3 donnent le même résultat. 
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EXERCICE 5 


Maintenant, vous allez réaliser un test HOAC de Bierens. Cliquez sur Done puis sur No. 
Unit root and stationarity tests s’affiche : cliquez sur Bierens HOAC. Ensuite, à la question 
«do you want to change Mu? », répondez No. Cliquez sur Continue. Les résultats sont les 
suivants : 


Bierens’ unit root tests on the basis of higher-order sample auto- 
correlations: The following two tests will be conducted: 

HOAC(1,1) and HOAC(2,2), which test the unit root hypothesis 

against the stationarity hypothesis. 

These tests depend on parameters Mu > 0, Alpha > 0, and 0 < Delta < 1, 
and the lag length p of the sample autocorrelations is: 

p = 1 + [Alpha * (n {\char 94} q)], where q = Delta * Mu / (3 * Mu + 2). 
The default values of these test parameters are: 

Mu = 2, Alpha = 5, Delta = .5 

Reference: 
Bierens, H.J. (1993): Higher Order Autocorelations and the Unit 

Root Hypothesis. Journal of Econometrics 57, 137--160 

Time series to be tested for a unit root: 

oblr 

Available observations : t = 1(=1963),...,3/7(=1999) 

= Chosen 

Default lag length: 

p = 1 + [Alpha*(n{\char 94}q)] = 9, where q = Delta*Mu / (3*Mu + 2) = .126, 
with n = 37, Mu = 2, Alpha = 5, Delta = .5 

The default values for Mu, Alpha and Delta have been adopted. 

Test statistics: 5\,\% Crit. Value 10\,\% Crit. Value 

HOAC(1,1) = -6.01 -14.00 -11.20 

HOAC(2,2) = -8.15 -15.70 -13.10 

Conclusion: Unit root hypothesis is not rejected. 


De nouveau, hypothèse de racine unitaire n’est pas rejetée. 


MODÉLISATION DU TAUX DE RENDEMENT DES OAT 


Énoncé 


Spécifiez et estimez un modèle de type ARIMA pour le taux de rendement des OAT à 10 
ans, en données journalières du 1/1/1998 au 22/9/2000. Utilisez la série OBL du fichier 
INR:xls téléchargeable à partir du site afférent à cet ouvrage. 


Un graphique montrant l’évolution du taux de rendement OBL des OAT (Obligations 
Assimilables du Trésor) à 10 ans suggère que cette série a une moyenne en augmentation 
légère, ainsi qu'une variance (amplitude autour de la moyenne) en augmentation. Ces 
caractéristiques sont cependant peu perceptibles, si bien qu'avant de décider que cette 
série n’est pas stationnaire et de lui chercher une transformation stationnaire, on peut 
supposer qu’elle est stationnaire et calculer ses autocorrélations simples et partielles pour 
identifier un modèle ARMA qui lui conviendrait. On utilise en ce sens le programme TSP 
suivant : 

freq n; 

smpl 1 712; 

read(file=‘inr.x1s"); 

bjident obl: 
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Après la lecture des données de la série OBL dans le fichier INR.XLS, l'instruction BJIDENT 
calcule les autocorrélations simples et partielles. Les résultats sont les suivants : 


PROGRAM 
LI NE XXL EXÉ EEE 
| 1 freq n: 
| 2 smpl 1 712; 
| 3 read(file=‘inr.x1s"); 
| 4 bjident obl; 
EXECUTION 
Current sample: 1 to 712 
Box-Jenkins procedures 
Procedure BJIDENT 
OPTIONS FOR THIS ROUTINE 
TAC = FALSE NDIFF = 0 NLAG = 20 
NLAGP = 10 NSDIFF = 0 NSPAN = 0 
PLOT = TRUE PLOTAC = TRUE PLTRAW = FALSE 
Autocorrelations 
0 0 0 
Series (1-B) (1-B ) OBL 
Mean = 4.8555614 
Standard Error = 0.5/7344979 
Lags 
Autocorrelations 0.994 0.988 0.984 0.979 0.975 
Standard Errors 1=-:5 0.3/75E-01]10.646E-0110.832E-0110.982E-01|0.111 
Q-statistics 706. 0.141E+0410.210E+0410.279E+0410.347E+04 
Autocorrelations 0.972 0.968 0.964 0.959 0.955 
Standard Errors 6-10 0.122 0.133 0.142 0.151 0.160 
Q-statistics 0.415E+0410.483E+0410.550E+0410.616E+0410.682E+04 
Autocorrelations 0.951 0.947 0.942 0.939 0.936 
Standard Errors 11-15 [0.167 0.175 0.182 0.189 0.195 
Q-statistics 0.748E+0410.813E+0410.878E+0410.942E+0410.101E+05 
Autocorrelations 0.932 0.928 0.924 0.920 0.915 
Standard Errors 16-20 [0.201 0.207 0.213 0.219 0.224 
Q-statistics 0.107E+0510.113E+0510.119E+0510.126E+0510.132E+05 
Partial Autocorrelations 
0 0 0 
Series (1-B) (1-B ) OBL 
Standard Error of Autocorrelations = 0.3/7476584E-01 
[Lags 
Partial Autocorrs |1- 5 |0.994 [0.378E-01 |0.103 10.135E-02 |0.379E-01 
Partial Autocorrs |6-10 |0.620E-01|-0.177E-01}-0.253E-01/1-0.223E-01|-0.775E-02 
Partial Autocorrs |11-15|0.375E-0114.86 [0.573 15.33 [5.34 
Partial Autocorrs |16-20]5.20 [5.19 15.17 [5.14 [5.10 


Partial Auto 


corrs [21-10] | | 
0 0 0 
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Autocorrelation Function of the series (1-B) (1-B ) OBL 
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Les autocorrélations simples ne diminuent pas rapidement avec laugmentation du 
retard 0, mais restent élevées pour des retards 8 importants : c’est une caractéristique 
des processus non stationnaires. Il ne faut donc pas modéliser la série OBL telle qu’elle 
est, mais lui trouver d’abord une transformation stationnaire. 


Le deuxième graphique montre l’évolution de la première différence de OBL. Cette 
nouvelle série est DOBL. Cette fois, la moyenne de la nouvelle série semble bien constante 
dans le temps, et la variance aussi. On suppose donc qu’elle est stationnaire et l’on 
peut calculer ses autocorrélations simples et partielles pour identifier un modèle ARMA 
convenable. On utilise en ce sens le programme TSP suivant : 
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freq n; 
smpl 1 712; 
read(file=‘inr.x1s”); 
bjident obl; 

smpl 2 712; 
dobl=obl-ob1(-1); 
bjident dobl: 


Après la lecture des données de la série OBL dans le fichier INR.XLS, et la modification de 
l'échantillon pour le calcul de la première différence DOBL, l'instruction BJIDENT calcule 
les autocorrélations simples et partielles de DOBL. Les résultats sont les suivants : 


PROGRAM 
LI NE XXL EXÉ EEE 
1 freqn; 
smpl 1 712; 
read(file=‘inr.x1s”); 
pl 2 712; 
dobl=obl-obl(-1); 
jident dobl; 
EXECUTION 


D O1 & © DR 
@] 


[°A 


Current sample: 1 to 712 
Current sample: 2 to 712 


Box-Jenkins procedures 
Procedure BJIDENT 


OPTIONS FOR THIS ROUTINE 


TAC = FALSE NDIFF = 0 NLAG = 20 
NLAGP = 10 NSDIFF = 0 NSPAN = 0 
PLOT = TRUE PLOTAC = TRUE PLTRAW = FALSE 
Autocorrelations 
0 0 0 
Series (1-B) (1-B ) DOBL 
Mean = 0.15/7383/6E-03 
Standard Error = 0.5/7238/708E-01 
Lags 

Autocorrelations -0.51/7E-011-0.109 -0.100E-01|-0.214E-01|-0.556E-0 
Standard Errors 1- 5] 0.3/75E-0 0.376E-0 0.380E-0 0.380E-0 0.381E-0 
Q-statistics 1.91 10.4! 10.4 10.8 3.0 
Autocorrelations 0.449E-0 0.451E-0 0.154E-0 0.110E-01/-0.127E-0 
Standard Errors 6-10] 0.382E-0 0.383E-0 0.383E-0 0.383E-0 0.383E-0 
Q-statistics 14.4 15.::9 6.1 16.2 16.3 
Autocorrelations 0.495E-021-0.127E-01|-0./710E-01|-0.116E-0 0.142E-0 
Standard Errors [11-15] 0.383E-0 0.383E-0 0.384E-0 0.385E-0 0.385E-0 
Q-statistics 16.3 16.4 20.1 20.2 20.3 
Autocorrelations 0.261E-0 0.227E-01|-0.457/E-02| 0.3/71E-0 0.248E-0 
Standard Errors [16-20[ 0.385E-0 0.386E-0 0.386E-0 0.386E-0 0.386E-0 
Q-statistics 20.8 21.2 212 22.2 22.7 
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Partial Autocorrelations 


0 0 0 
Series (1-B) (1-B ) DOBL 

Standard Error of Autocorrelations = 0.3/7502930E-01 
Lags| 
Partial Autocorrs -5 |-0.517E-01|-0.112 |-0.224E-01|-0.360E-01/-0.637E-01 
Partial Autocorrs| 6-10] 0.315E-01] 0.360E-01} 0.266E-01| 0.217E-01|-0.524E-02 
Partial Autocorrs -15| 0.375E-01| 0.157E-03| 0.572E-01| 0.200E-02|-0.133 
Partial Autocorrs|16-20|-0.120E-01/-0.200E-01/-0.260E-01|-0.450E-01]-0.390E-01 
Partial Autocorrs|21-10| | | 


+ 


0 0 0 
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Sur les autocorrélogrammes simples et partiels, donc sur les graphiques des autocorréla- 
tions simples empiriques et des autocorrélations partielles empiriques, les R représentent 
les autocorrélations empiriques simples r et partielles dy. Sur chaque graphique, sont 
également dessinées les bornes d’un intervalle. Si un coefficient d’autocorrélation empi- 
rique (c’est-à-dire estimé) d’un certain ordre 8 se trouve à l’intérieur de l'intervalle, on ne 
rejette pas l'hypothèse que le coefficient d’autocorrélation vrai correspondant est nul. 


Ces graphiques sont précédés de tableaux donnant les valeurs calculées de ces coefficients 
d’autocorrélation empiriques, pour chaque retard (lag) allant de 1 à 20. Dans le tableau 
des autocorrélations simples empiriques r, (le premier tableau), on trouve, sous chaque 
coefficient d’autocorrélation estimé, une estimation de son écart type (standard error) et 
un test Q-statistic, qui est celui de Ljung et Box [LJU 1978]. 


Le graphique des autocorrélations simples empiriques ro (les valeurs estimées des po) 
suggère que seuls les coefficients d’autocorrélation p1 et p2, voire p, uniquement, sont non 
nuls. Le modèle ARMA adéquat serait donc un MA(2). Le graphique des autocorrélations 
partielles oo (les valeurs estimées des bp) suggère une sinusoïde s’amenuisant, ce qui est 
possible pour un MA(2). On peut donc estimer un modèle MA(2) pour DOBL, grâce au 
programme suivant : 


freq n; 

smpl 1 712; 

read(file=‘inr.x1s’); 

smpl 2 7/12; 

dobl=obl-obl(-1); 

bjest(nma=2,nar=0 ,constant,nocumplo,noplot) dobl:; 


Après la lecture des données de la série OBL dans le fichier INR.XLS, et la modification 
de l'échantillon pour le calcul de la première différence DOBL, l'instruction BJEST lance 
l'estimation d’un modèle ARMA pour DOBL. Plus précisément, les options nma=2 ,nar=0 
demandent d’estimer un MA(2). En effet, l'option nma=2 exige deux coefficients auto- 
régressifs, tandis que l'option nar=0 ne nécessite aucun coefficient de moyenne mobile. 
constant donne à ce modèle une constante 11, et les autres options empêchent l’insertion 
d’une série de graphiques dans les résultats. La sortie est la suivante : 


Autocorr 0.044909 0.044762 PROGRAM 
LI N E KKKKKKKKKLKKKKKKKKKLXKKKLKEKKKKKKKKKKEKEKKKLKEKEKKEKEKKKLXKKKKKRKEKEKRKXXEXX 
1 freqn; 
2  smpl 1 712; 
3 read(file=‘inr.xls’); 
4  smpl 2 712; 
5  dobl=obl-obl(-1); 
6 bjest(nma=2,nar=0,constant,nocumplo,noplot) dobl; 


EXECUTION 


Current sample: 1 to 712 
Current sample: 2 to 712 


Box-Jenkins procedures 
Procedure BJEST 


Working space used: 9217 
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THETAI THETA2 CONSTANT 
VALUE 0.051695 0.10877 0.000157/38 
F= -1031.4 FENEW= -1031.5 ISQZ= O0 STEP= 1.0000 CRIT= 0.18165 
F=  -1031.5 ENEW= -1031.5 ISQZ= O0 STEP= 1.0000 CRIT= 0.84606E-03 
F=." <1031:5 ENEW= -1031.5 ISQZ= O0 STEP= 1.0000 CRIT= 0.53143E-05 


CONVERGENCE ACHIEVED AFTER 3 ITERATIONS 
6 FUNCTION EVALUATIONS. 
Results of Box-Jdenkins Estimation 


Dependent variable: DOBL 
Current sample: 2 to 7/12 
Number of observations: 7/11 


Mean of dependent variable = .15/7384E-03 

Std. dev. of dependent var. = .057239 

Sum of squared residuals = 2.28724 

Variance of residuals = .323057/7E-02 

Std. error of regression = .056838 
R-squared = .0167/54 

Adjusted R-squared = .013976 

Durbin-Watson statistic = 1.99433 

F-statistic (zero slopes) = 6.02163 

Log of likelihood function = 1031.46 


Standard 
Parameter Estimate Error t-statistic 
THETAI .064547 .037309 1.73004 
THETA2 .119353 .037310 3.19891 


CONSTANT .194120E-03 .1/4057E-02 .111527 


Standard Errors computed from quadratic form of analytic first 
derivatives (Gauss) 
Autocorrelations of the Residuals 


1 2 3 4 5 
Autocorr 0.0028068 0.0054788 -0.016550 -0.019274 -0.050715 
Q-stat 0.0056250 0.027088 0.22321 0.489359 2.33643 
P-value ; . : 0.48411 0.31092 
6 pl 8 9 10 
Autocorr 0.044909 0.044762 0.022727 0.016507 -0.011537 
Q-stat 3./78664 5.22945 5.60193 5./9871 5.89497 
P-value 0.28544 0.26455 0.34690 0.44611 0.55207 
11 12 13 14 15 
Autocorr -0.0033513 -0.019970 -0.071881 -0.014134 0.010081 
Q-stat 5.90310 6.19233 9.94497 10.09026 10.16428 
P-value 0.65809 0./2053 0.44533 0.52229 0.60155 
16 17 18 19 20 
Autocorr 0.027060 0.030335  0.0057656 0.040393 0.027058 
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Q-stat 10.69839 11.37057 11.39489 12.59014 13.12728 
P-value 0.63607 0.65671 0./2413 0./0246 0./2762 


Les résultats semblent indiquer qu’un modèle MA(2) est une bonne description du vrai 
processus stochastique dont DOBL est une réalisation observée : 


DOBL, = CONSTANT + v; — THETA1v;_1 — THETA2v; 2 
= .194120E — 03 + v; — .064547v;_1 — .119353v;_; 


où v, est un résidu calculé, CONSTANT la valeur estimée de 11, et THETAI et THETA2 
les valeurs estimées de 0: et 62. 


Les t-stats permettent de tester l’hypothèse qu’un coefficient vrai vaut 0, en étant distri- 
buées approximativement par une N(0, 1) si c’est vrai. À 5%, la valeur critique est de 
1,96 et l’on ne peut donc rejeter l’hypothèse que 8, = 0. Cela ne veut pas dire qu’on est 
sûr que 0, — 0. Cela signifie que c’est une possibilité que l’on ne peut rejeter, parmi une 
infinité d’autres valeurs qui ne seraient pas rejetées non plus. Ces valeurs de 8; non rejetées 
appartiennent à l’intervalle de confiance allant de « THETAI — 1,96X écart type estimé 
de THETAI » à « THETAI + 1,96 écart type estimé de THETAI », qui a 90 chances sur 
100 de contenir la valeur « vraie inconnue » de 8;. Par conséquent : 


P(064547 — 1,96(0.037309) < 0, < 064547 + 1,96(0.037309)) — 0.9 


Le terme d’erreur vrai semble être un bruit blanc d’après les tests Q-stat (de Ljung et 
Box [LJU 1978]) sur les autocorrélations des résidus. Chaque test Q-stat vérifie en effet 
l'hypothèse que les autocorrélations des ordres allant de 1 à une certaine valeur ; (indiquée 
au-dessus du test dans le tableau) sont nulles, donc que le résidu n’est pas corrélé avec 
ses i valeurs précédentes. Si l'hypothèse est vraie, le test est distribué selon une Chi-2 à 
degrés de liberté. Les probabilités critiques indiquées étant supérieures à 0,05 pour toutes 
les valeurs de i présentées, on ne rejette pas l'hypothèse d’absence d’autocorrélation du 
résidu y, au seuil de 5 %. 


Si l’on veut utiliser ce modèle pour effectuer des extrapolations de la série sur des périodes 
ultérieures, on exécute la commande TSP spéciale BJFRCST. Par exemple, si un analyste 
souhaite, le 22/9/2000, prévoir les taux d’intérêt des 10 prochains jours ouvrables, et 
dispose des observations historiques des 712 derniers jours, il envoie à TSP le programme 
suivant : 


freq n; 

smpl 1 712; 

read(file=‘inr.x1s’); 

pl 2 712; 

bl=obl-ob1(-1); 

jest(nma=?2,nar=0 constant ,nocumplo,noplot) dobl: 
frest(constant,nar=0,nma=2,retrieve,nhoriz=10,orgbeg=/12,print) dobl; 
pl 712 712; 

1f=obl; 
smpl 713 722; 
oblf=@fit+oblf(-1); 
print oblf; 


Les options constant ,nar=0,nma=2 demandent que la prévision soit utilisée avec un 
modèle MA(2) avec constante. retrieve indique que le logiciel n’a pas besoin d’estimer ce 
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modèle mais qu’il peut tout simplement récupérer les coefficients estimés par la commande 
BJEST précédente. nhor iz=10 exige de prévoir les valeurs pour 10 périodes successives. 
orgbeg=712 indique la date d’origine à partir de laquelle il faut calculer les extrapolations. 


Le logiciel calcule des prévisions sur DOBL (la variation des taux d’intérêt) et Les stocke 
en mémoire sous le nom @fit. Les instructions suivantes transforment ces prévisions sur 
DOBL en prévisions (appelées ob1 f) sur le niveau OBL des taux d’intérêt. 


On retrouve alors le même fichier de résultats TSP que précédemment, avec en plus les 
résultats suivants de l’instruction BJFRCST ajoutée au programme : 


Box-Jenkins procedures 
Procedure BJFRCST 


OPTIONS FOR THIS ROUTINE 
CONBOUND = 0.95000 CONSTANT = TRUE NAR = 0 
NBACK = 100 NDIFF = 0 NHORIZ = 10 
NLAG = 20 NMA = 2 NSAR = 0 
NSDIFF = 0 NSMA =:0 NSPAN = 0 
ORGBEG = 712 ORGEND = 712 PLOT = FALSE 
PRINT = TRUE RETRIEVE = TRUE 
TIME SERIES :DOBL 
STANDARD ERROR OF THE DISTURBANCE = 0.056838 


THETA(B) 
2 
1 - 0.064547 B - 0.11935 B 


CONSTANT =0.00019412 
THETAX(B) 
2 
1 - 0.064547 B - 0.11935 B 


FORECAST STANDARD ERRORS AND PSI WEIGHTS 


STD ERR PSI 
l 0.056838 -0.064547 
2 0.056956 -0.11935 
3 0.057359 0.00000 
4 0.057359 0.00000 
5 0.057359 0.00000 
6 0.057359 0.00000 
7 0.057359 0.00000 
8 0.057359 0.00000 
9 0.057359 0.00000 
10 0.057359 0.00000 
Forecasts and 95\% Confidence Bounds (Origin = 712) 
Lowr Bnd Forecast Uppr Bnd Actual Error 
712 -0.0012999 -0.0012999 -0.0012999 -0.0012999 0.00000 
713 -0.10731 0.0040861 0.11549 
714 -0.11011 0.0015212 0.11315 
715 -0.11223 0.00019412 0.11262 
716 -0.11223 0.00019412 0.11262 
717 -0.11223 0.00019412 0.11262 


Tests de racine unitaire et modèles ARIMA 197 


198 


718 -0.11223 0.00019412 0.11262 
719 -0.11223 0.00019412 0.11262 
720 -0.11223 0.00019412 0.11262 
727 -0.11223 0.00019412 0.11262 
722 -0.11223 0.00019412 0.11262 


Current sample: 712 to 712 
Current sample: 713 to 722 
NOTE: Dynamic GENR for OBLF 


OBLF 
713 5.44999 
714 5.45151 
715 5.45170 
716 5.45190 
717 5.45209 
718 5.45228 
719 5.45248 
720 5.45267 
721 5.45287 
722 5.45306 


Le logiciel calcule des extrapolations des valeurs de DOBL (colonne Forecast) pour toutes 
les périodes demandées, et indique pour chaque période les bornes inférieure (colonne 
Lowr Bnd) et supérieure (colonne Uppr Bnd) d’un intervalle qui a une probabilité de 95 % 
de contenir la valeur « vraie encore inconnue » de DOBL à la période considérée. Ensuite, 
les extrapolations de DOBL sont transformées en extrapolations sur OBL (colonne OBLF). 
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Ce chapitre définit d'abord la cointégration entre 
variables intégrées du même ordre. Il décrit également 
les tests de cointégration d’Engle et Granger, avant 
d'aborder les estimateurs modifiés des coefficients 
d’une relation linéaire entre variables intégrées. Il 
détaille ensuite les propriétés de cointégration dans 
une modélisation VAR et les tests de Johansen. Grâce 
à cette structure d'analyse, on peut approfondir la 
modélisation en définissant les notions de VAR 
conditionnel à correction d'erreur et de modèle 


structurel à correction d'erreur. 


El Problèmes 
économétriques liés 
aux variables intégrées 


Plusieurs problèmes se posent lorsqu'on veut vérifier l'existence 
d’une relation linéaire entre plusieurs variables dont certaines ont 
une tendance stochastique (donc une racine unitaire), et lorsqu'on 
veut estimer les paramètres de cette relation supposée : 
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+ Même si, dans la réalité, aucune relation linéaire ne lie ces variables, une estimation par 
MCO peut donner des résultats qui font croire faussement qu’une telle relation existe 
et qu'elle est importante (R? élevé, t-stats significatifs.). C’est le phénomène bien 
connu de régression fallacieuse ou régression factice (spurious regression 1) en anglais) 
[GRA 1974] et [PHI 1986]. En fait, l'existence d’une réelle relation à long terme entre 
des variables intégrées est soumise à certaines conditions, appelées cointégration entre les 
variables intégrées. En d’autres termes, si les variables sont intégrées (ce que l’on vérifie 
avec les tests de racine unitaire), il faut vérifier leur éventuelle cointégration pour 
savoir si elles entretiennent réellement une relation à long terme. Ces conditions de 
cointégration sont détaillées dans ce chapitre, ainsi que des méthodes permettant 
de vérifier empiriquement une éventuelle cointégration entre des variables intégrées 
observées. 


Même en cas de cointégration entre la variable dépendante et les variables explicatives, 
les estimateurs des moindres carrés ordinaires convergent « trop vite » pour être distri- 
bués d’après une loi normale. Par conséquent, les tests d’hypothèse usuels ne suivent 
pas les lois Student ou asymptotiquement normales : l’inférence statistique classique 
(voir chapitres 2, 3 et 4) ne s'applique pas. D’autres techniques d’estimation permettent 
toutefois de générer des tests d’hypothèse sur les coefficients cointégrants, qui utilisent 
des distributions connues. 


F1 Définition de la cointégration 


Des processus stochastiques X1, X: ... X,, intégrés du même ordre d sont cointégrés s’il 
existe une combinaison linéaire de ces processus qui est intégrée d’un ordre inférieur à d. 


Il faut donc qu’il existe une valeur b > 0 et des valeurs B,B2...f,, vérifiant : 
o BiX1 + B2X2 +: + B,,X, est I(d — b). 
+ Chaque variable X;,,X;, ...X, est I(d). 


Remarque 


En pratique, le cas le plus fréquent est celui où toutes les variables sont intégrées d'ordre 1 
(d = 1}, et où il existe une combinaison linéaire de celles-ci, stationnaire et donc intégrée 
d'ordre O {b= 1 et d—b=1—1— 0). 


La définition générale permet toutefois de tenir compte d'autres cas possibles, quoique rares. 
Par exemple, des variables peuvent être chacune 1(2) et cointégrées en raison de l'existence 
d'une combinaison linéaire de celles-ci de type 1(1) (dans ce cas, d=2,b=1etd-b=—1) 
ou 1(0) (dans ce cas, d=2,b=—2 et d—b=—0). 


B = (B1;, B2 .. . Bw)' est le vecteur cointégrant (ou de cointégration).B'X; = BiX1,+B2X2 + 
+ B,X, est l'expression cointégrée. 


Il peut exister plusieurs vecteurs cointégrants linéairement indépendants pour les mêmes w 
variables. Le nombre de ces vecteurs est noté r. Dans tous les cas, r < w;en d’autres termes 
on ne peut avoir plus de w — 1 vecteurs de cointégration linéairement indépendants. 


1. On doit la découverte de ce phénomène à Yule [YUL 1926]. 
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Toute combinaison linéaire de vecteurs de cointégration pour des variables est aussi un 
vecteur de cointégration pour ces variables. Tout multiple d’un vecteur de cointégration est 
également un vecteur de cointégration. Bien entendu, ce nouveau vecteur est linéairement 
dépendant du premier. 


Une même direction vectorielle est représentée par une infinité de vecteurs, tous linéaire- 
ment dépendants, tous combinaisons linéaires les uns des autres. L'espace de vecteurs de 
cointégration est donc infini, même si r = 1, c’est-à-dire même s’il existe un seul vecteur 
de cointégration linéairement indépendant. Par « r vecteurs de cointégration linéairement 
indépendants », on entend donc « r directions vectorielles de cointégration différentes », 
chacune d’elles étant représentée par une infinité de vecteurs qui sont des multiples 
les uns des autres. Pour représenter de manière unique chacune de ces r directions 
vectorielles de cointégration, il faut appliquer une règle de normalisation arbitraire : par 
exemple, on peut les représenter toutes par leur vecteur dont le premier coefficient (le 
coefficient de la première variable) vaut 1, ou encore par leur vecteur dont le deuxième 
coefficient (celui de la deuxième variable) vaut 1... On peut aussi représenter la première 
direction vectorielle (respectivement, la deuxième, la troisième...) par son vecteur dont le 
premier (respectivement, le deuxième, le troisième...) coefficient vaut 1(et ainsi de suite). 


Quand r > 1, même si chacune des r directions vectorielles a été normalisée et est donc 
représentée par un seul vecteur normalisé, toute combinaison linéaire de ces r vecteurs est 
aussi un vecteur de cointégration. Avoir normalisé les directions initiales ne suffit donc pas 
à limiter le nombre de vecteurs à r. Pour sélectionner seulement r vecteurs, il faut en plus 
appliquer une règle arbitraire d’identification, généralement fournie par des restrictions 
sur les coefficients suggérées par la théorie économique, financière, marketing. 


L'exemple le plus fréquent est celui de w variables X;, X2...X,, toutes 1(1) et cointégrées 
s’il existe une combinaison linéaire B,X, + B2X2 + ::: + B,,X,, stationnaire, donc une 
expression B1X1 + B2X2 +: -: +6B,,X,,1(0). En pareil cas, chaque variable individuelle est 
non stationnaire avec une tendance stochastique puisqu’elle est 1(1), et a donc tendance 
à s'éloigner davantage de ses propres conditions initiales, avec de larges fluctuations. 
Toutefois, étant cointégrées, ces variables divergent ensemble : elles ont tendance à ne pas 
trop s'éloigner les unes des autres, puisqu’une fonction de ces variables reste stationnaire. 
Une force économique les relie donc à long terme, de manière qu’elles ne s’écartent pas 
durablement d’une relation d'équilibre. 


La combinaison linéaire 8, X1+B2X2+:--+86,,X,, représente la déviation par rapport à une 
relation d’équilibre entre les variables. La cointégration implique que cette déviation est 
stationnaire : elle fluctue autour d’une espérance constante, avec une dispersion constante. 
Cette déviation n’a donc pas tendance à diverger, à devenir trop grande : Les variables ne 


2 


s’écartent pas durablement de leur relation d'équilibre. 


Exemple 
À long terme, la consommation agrégée réelle doit être proportionnelle au revenu disponible 
réel des ménages, d'après la théorie économique. À l'équilibre, il faut donc que : 


C=AY 


où C est la consommation totale réelle, A une constante et Y le revenu disponible total réel. 
En effet, la théorie économique montre que, logiquement, le taux de consommation doit être 
constant à l'équilibre : 


C 
PA = À 
Y 
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ou encore que le taux d'épargne doit l'être aussi : 


Y-C. 
= 


1—-A 


Par conséquent, la relation suivante est vérifiée à l'équilibre : 
In(C) = A’ +In(Y) 


où A’ — In(A). Bien entendu, cette relation prévaut sur le long terme, mais pas à court terme, ni 


à chaque période r. À court terme, la consommation logarithmique In(C;) peut s'écarter de son 
équilibre A’ + 1In(Y;) d'un certain montant u, : 


In(C;) = A'+In(Y;)+w pour tout t 


Mais u, ne peut devenir indéfiniment grand : il doit fluctuer autour de O, de manière stationnaire, 
pour permettre à la relation d'équilibre de prévaloir approximativement sur le long terme. Les 
tests de racine unitaire indiquent que les variables In(C;) et In(Y,) liées par la relation précédente 
sont intégrées. Cette équation s'écrit encore : 


In(C;) — In(Y:) = A'+w pour tout t 


où A’ est une constante et 1, Un processus stochastique stationnaire. La théorie économique 
implique ainsi que la combinaison linéaire In(C;) — In(Y,) est stationnaire, donc que In(C;) 
et In(Y,) sont cointégrées, avec B1 — 1 et B2 — —1. Les tests de cointégration qui suivent 
permettent de vérifier concrètement, sur les données de la réalité, si cette implication de la 
théorie économique est vraie. 


El Test de cointégration d’Engle et Granger 


PRINCIPE 


Le test d’Engle et Granger est une méthode de vérification de l’existence d’une relation de 
cointégration entre des variables intégrées et d’estimation de cette relation. Cette méthode 
est valable sous l’hypothèse arbitraire qu’il existe un seul vecteur de cointégration entre 
les variables utilisées, et que b = d. 


Le raisonnement est Le suivant : en cas de cointégration entre X,, X:...X,, il existe des 
valeurs 81,82 ...B,, telles que : 


BiXs +B2X2 +... +B,X, est (0) (6.1) 

et donc telles que : 

X:1 + By ... Buy est aussi 1(0) (6.2) 

Bi Bi 

et donc telles que : : : 

X1+BX2 +... +6,X, est aussi I(0) (6.3) 
où les coefficients sont normalisés : Br — Bi = 1, B2 = Br ae By = Bu, 

Bi Bi Bi 


Tout processus 1(0) est forcément égal à une constante (son espérance) + un processus 
1(0) d'espérance nulle. La stationnarité de X, + B,X; + - -- + 6,,X,, implique que: 


XY + B2X> + mie + Pas — H + Ur (6.4) 
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où pu est une constante (non aléatoire) et u un processus stochastique stationnaire 1(0) —_— 


d'espérance nulle. n’est pas nécessairement un bruit blanc. Il peut être autocorrélé, dès 
lors qu’il est stationnaire. La cointégration implique donc que : 


Xu = + (—B2)X2e + + (Be) Xe + (6.5) 


où les coefficients cointégrants normalisés fi: ...f,, sont les seuls pour lesquels u possède 
les propriétés équivalentes suivantes : 


- Ilest stationnaire 1(0). 

+ Il n’a pas de tendance stochastique. 

+ Il n’a pas de racine unitaire. 

+ Il a une variance constante (voir chapitre 5). 


Les coefficients cointégrants de l’équation précédente sont susceptibles d’être estimés par 
MCO. Cette méthode cherche les valeurs des coefficients qui minimisent la somme des 
carrés des résidus. Minimiser cette somme revient à chercher les valeurs des coefficients 


t=1 

n—w _ L 
la variance de u est finie uniquement pour les coefficients cointégrants B2...f,. Pour 
d’autres valeurs (d’autres combinaisons linéaires des X;,), u est I(1) et a une variance 
infinie. Par conséquent, en cas de cointégration, et donc s’il existe des coefficients 
cointégrants —B.. — B,, pour lesquels le terme d’erreur w de l'équation précédente 
a une variance constante, l’estimation de cette équation par MCO doit nécessairement 
fournir des valeurs estimées de ces coefficients cointégrants. 


qui minimisent la variance estimée des u, puisque 62 = (voir chapitre 4). Or 


Tester la cointégration entre les variables revient donc à estimer par MCO une équation 
linéaire où l’une de ces variables est régressée sur les autres et à tester si le résidu a une 
racine unitaire. Si l’on ne rejette pas l'hypothèse de racine unitaire pour le résidu estimé, 
les variables de l’équation ne sont pas cointégrées ; si on la rejette, elles Le sont. 


Toutefois, les variables étant intégrées, l’inférence statistique classique ne s’applique pas. 
Les t-ratios des coefficients estimés n’ont pas une distribution Student pour des petits 
échantillons, ni une distribution gaussienne pour de grands échantillons, sous l'hypothèse 
de nullité du coefficient vrai correspondant. Les probabilités critiques des t-ratios, indi- 
quées par défaut par les logiciels et calculées à partir d’une distribution Student, ne sont 
donc pas fiables. À ce niveau, il est donc impossible de réaliser des tests d’hypothèse et des 
intervalles de confiance, pour vérifier s’ils admettent des valeurs des coefficients plausibles 
économiquement. Il est donc nécessaire de estimer de nouveau la relation proposée au 
moyen des estimateurs Fully Modified (FM) de Phillips et Hansen [PHI 1990a], qui 
fournissent des valeurs estimées différentes, accompagnées d’écarts types permettant une 
inférence statistique classique (voir section 4.2). 


3.2 COINTÉGRATION ET MÉCANISME À CORRECTION D'ERREUR 


Selon le théorème de représentation de Granger, en cas de cointégration entre des variables 
intégrées d’ordre 1, l’évolution de chacune d’elles est régie nécessairement par un modèle 
à correction d'erreur. Pour chaque variable cointégrée, un modèle linéaire existe donc, 
où la variation de la variable est une fonction de ses variations passées et des variations 
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passées des autres variables, ainsi que de la valeur passée de l’expression cointégrée : 


X1,X2...X, cointégrées & Vi = 1,...,w : 


12 fe 
AK = pui + DU D pe X 0 + (Xi — Bas — Pix à) +u (6.6) 
j=1 6=1 
où u;, est un processus stochastique de type bruit blanc. Un tel modèle est dit « à correction 
d'erreur » (on parle aussi de mécanisme à correction d’erreur). 


L'expression cointégrée retardée, notée (x — B2X2-1 —: — BuXuer), représente 


l'écart (ou l« erreur ») par rapport à la relation d’équilibre (1) à la période t — 1. Le 
paramètre À; correspond donc au taux de réaction de la variable X; à l’écart précédent par 
rapport à l'équilibre. À; mesure ainsi l’intensité avec laquelle la variable X; varie en f pour 
corriger l’erreur de la période t — 1 par rapport à équilibre. C’est pourquoi on parle de 


modèle à correction d’erreur. 


F1 Estimateurs modifiés 
INTÉRÊT PRATIQUE 


En cas de cointégration entre des variables, estimation par MCO d’une équation linéaire, 
expliquant une de ces variables par les autres, fournit un estimateur des coefficients 8 dont 
la distribution asymptotique n’est pas une loi normale. Il en résulte que la distribution 
asymptotique d’un test de Wald de restrictions sur B n’a pas une distribution classique mais 
dépend, sous l'hypothèse nulle, de plusieurs paramètres de nuisance, et plus précisément : 


+ D’un biais qui est fonction des liens entre le terme d’erreur et les variables contempo- 
raines et retardées. 


+ Des variances du terme d’erreur et d’un mouvement brownien U particulier, associé à 
l'accumulation des termes d’erreur successifs, qui ne sont égales que si le terme d’erreur 
n’est pas autocorrélé. 


+ Des covariances entre deux mouvements browniens U et B, associés à l’accumula- 
tion des termes d’erreur successifs et à l'accumulation des variations successives des 
variables explicatives. Ces covariances ne sont nulles que si les variables explicatives 
sont strictement exogènes pour l'équation. 


L'intérêt pratique est évidemment de parvenir à vérifier des restrictions au moyen de tests 
ayant une distribution asymptotique classique. Il faut donc corriger le test de Wald pour 
que la version corrigée ait une distribution asymptotique classique. Les deux premiers 
problèmes cités précédemment peuvent être résolus par l’extension des méthodes de 
Park et Phillips (1988). Le troisième peut être réglé à l’aide d’une méthode proposée par 
Phillips et Hansen [PHI 1990a], qui permet d'obtenir un nouvel estimateur de B, différent 
de l’estimateur des MCO. Ce nouvel estimateur a une distribution asymptotique normale 
conditionnellement à B. Il en résulte qu'une fonction quadratique de cet estimateur 
a une distribution Chi-2. Par conséquent, les tests standard de Wald, du rapport de 
vraisemblance et du multiplicateur de Lagrange, obtenus à partir du nouvel estimateur 
(dit «modifié »), ont également une distribution asymptotique Chi-2. 


1. Le mot « erreur » n’a pas le même sens que dans l’expression « terme d’erreur », où il est synonyme de 
«perturbation ». 
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A.2 FORMULES DES ESTIMATEURS a 


La méthode de Phillips et Hansen est appropriée pour estimer et tester les paramètres 
d’une équation linéaire reliant des variables (1) cointégrées Y, X, ... XK: 


Ph + BiXx +. + BeXe + us (6.7) 
où chaque variable explicative est telle que : 
AXy=bi+vy Vt=2,...,n Vi=2,...,k (6.8) 


et où le vecteur formé par le terme d’erreur u, de équation linéaire et les différents v;, est 
stationnaire et a une matrice de variance et de covariance finie et définie positive. 


Le calcul de l’estimateur FM des B; par Phillips et Hansen se fait en deux étapes : 
1. On corrige y; pour l’interdépendance à long terme entre u; et les v;. On estime d’abord 


ü 
22 A 2 a Var NAN A 
l'équation de Y, par MCO et l’on forme le vecteur £, = ._ Joùd; = AX;—f; 
kr 
n 
AX; 
et = —E— Vi=2,...,k 
n—1 : 
Un estimateur convergent de la matrice de variance et de covariance de £,; est fourni 
par : 
Q=ÿ+A+A =." 7 (6.9) 
G1 2 


8 Dé 
De ce _ été 
n 


où È À=N o(jmf, À pate 

ù >» — , À = …_ o(j, ml, L; = et où &w(j, m) es 
| j=1 J bp 1j | J 

une fenêtre de retards avec une troncature m. Il existe plusieurs formes de fenêtre : 

— la fenêtre uniforme : 


w(jm) =1 pourtoutj =0...m 


— la fenêtre de Bartlett : 
W(j, M) = 1 — 2 pour tout =0...m 
m 


— Ja fenêtre de Parzen : 


, RT9 SNS 
: J J ; . LM 
Mm)=1—6 + 6 0<j< — 
et 
: \ 2 
W(j, M) = 2 ere im>j> 
i m F 2 
— la fenêtre de Tukey : 


. 1 Tj : m 
NÉS, 1 + cos ra PORN RS 


On choisit la valeur de m arbitrairement. Q11 est de typelxl, @ 2 de typelxk, 
(221 de type k x 1 et (22: de type k x k. 
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On définit les matrices suivantes : 


AU Ân À 
a=5+a= (fn :) (6.10) 


où D est une matrice de type (k+ 1) x k, 0 une matrice de type 1 x k, I; de type 
k x k, et Ÿ, est le vecteur formé par tous les Ÿ;,. 
2. L’estimateur modifié FM (Fully Modified) de B est défini par : 


PM = (WW) (Wÿ*— nD2) , (6.11) 
Îi 1 
um PS 
où y =| , |, W—(r,X) et 71, — (6.12) 
a 1 


Un estimateur convergent de la matrice de variance et de covariance de l’estimateur 


BEM est fourni par la formule : 


Ênu = Gn2(WW) , (6.13) 
où O2 = Qn — 000; (6.14) 


EH Modèles VAR et cointégration 


Une fois qu’on a vérifié la cointégration par la méthode d’Engle et Granger, et qu'on 
a estimé un vecteur de cointégration par MCO ou avec un estimateur Fully Modified, 
la relation estimée ne caractérise pas l’entièreté du lien dynamique entre les variables 
concernées. Elle ne mesure que la relation à long terme entre les variables et ne décrit 
pas toutes leurs interactions à court terme. En particulier, la relation de cointégration ne 
prétend pas expliquer exhaustivement toute l’évolution dynamique de l’une des variables 
en fonction de l’évolution dynamique des autres. D’ailleurs, son terme d’erreur doit 
seulement être stationnaire : il peut donc être autocorrélé. C’est bien la preuve que ce 
terme d’erreur peut contenir des fluctuations systématiques de la « variable de gauche » 
qui n’ont pas été expliquées par les fluctuations des « variables de droite ». 


5.1 DÉFINITION DES MODÈLES VAR 


Un groupe de variables aléatoires temporelles est généré par un modèle VAR si chacune de 
ses variables est une fonction linéaire de ses propres valeurs passées et des valeurs passées 
des autres variables du groupe, à laquelle s’ajoute un choc aléatoire de type bruit blanc. 
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Se | 
Exemple 


Deux variables aléatoires temporelles (processus stochastiques) X1, et X2, sont générées par un 
modèle VAR à deux retards, donc par un VAR(2], s'il existe des coefficients B; et y;, ainsi que 
des variables de type bruit blanc 1, et 2, tels que : 


Xi = Wii + PuXir1 + Pa2Nir-2 + P21X 2-1 + P22X 252 + Uyr 
X2 = bo + Yade + Ya X 12 + Va1X 2-1 + Y22X 252 + Ur 


Cela se représente encore par le système suivant : 


X X1r- X1r- u 
| Mi % Pi Pi 1-1 à. P21  P22 1-2 + 1t 
X2 m2 Yi  Y12 X2-1 Y21  Y2 X21-2 Ut 


ou, si l'on intègre l'opérateur de retard, de la façon suivante : 


Xw\ fl 4 [Pn pu LXir L [PA Pa LX1 + [tu 
X2 te Yu Ya LX3 Yai Ya LXy Ut 


OU encore : 


X X X 
| M1 Pi PI2 L 1f + P21  P22 L2 1£ + Uit 
X2 M2 YU Y12 X2 Y21  Y2 X2 Ut 


ce qui implique : 
1 0\ feu Pr [92 P2|)p Xi | _ fl + [ia 
0 1 Yu Ye Ya Y2 Xx ) Ua 


On peut alors fournir une définition générale précise d’un modèle VAR. 


Un processus stochastique multivarié X à n composantes est généré par un modèle VAR(p) 
s’il existe un vecteur 11, des matrices D; de type n x n, et un processus stochastique 
multivarié u, dont chaque composante est un bruit blanc, tels que : 


p 
X=u+) EX It (6.15) 
1 
et donc tels que : 
p 
h-) L}X=h+" (6.16) 
1 
ou encore tels que : 
PAIX; =h+u (6.17) 


où P(L) est un polynôme matriciel en l'opérateur de retard I, défini par : 


P 
dL={r-) a (6.18) 
1=1 
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Exemple (suite) 


Dans l'exemple précédent où n = 2, on a: 
X = (x) Te Fi Fr é . Fe É _ 
Xx M2 Yi V2 Y21  Y2 
2 de(s 3 Dee 4 
0 1 Ur 0 1 Yu Ya Y21 V2 
5.2 PROPRIÉTÉS DYNAMIQUES D'UN MODÈLE VAR 


L'équation caractéristique du modèle VAR(p) est 0 = |D(L)| = 


m7. ®iL/| où 
la notation |.| représente le déterminant. Si les racines de l’équation 0 = |(L)| sont en 
dehors du cercle unité, on montre que le polynôme ®(L) est inversible, et donc qu’il existe 
une infinité de matrices C; de type n x n telles que X, peut aussi s’écrire comme une 
moyenne mobile infinie des valeurs courantes et passées du choc aléatoire multivarié u : 


Xr = + Coté + Cius-1 + Cous2 +. (6.19) 


et donc telles que : 


(ee) 
X=h + D Crus 
1=0 


= +) CGLu = A +C(Lu 
1=0 


où CL) = D GL'X; = (LD) (u+u) = À + CD et done (D(1)) ‘n = À 
et (D(L)) = C(L). 
L'équation caractéristique (0 = |dD(L)|) du système VAR admet une ou plusieurs racines 


sas à . : P 
unitaires si 0 — [D(1)| et donc si la matrice D(1) — (1, — > 


4 &) est singulière. 


5.3 TESTS DE LA QUALITÉ DE LA SPÉCIFICATION 


Après avoir estimé un modèle VAR, et avant de tester des hypothèses sur les coefficients 
estimés, il faut vérifier si le modèle représente de manière appropriée la dynamique des 
variables modélisées. 

Il faut d’abord calculer des tests « portmanteau » séparément pour chaque équation 
du VAR pour vérifier l'hypothèse d’absence d’autocorrélation du terme d’erreur de 
chacune. Ensuite, il faut réaliser un test « portmanteau » vectoriel pour vérifier en une 


passe lhypothèse d'absence d’autocorrélation des termes d’erreur de toutes les équations 
du VAR. 


Test « portmanteau » de Ljung et Box [LJU 1978] 


Il s’agit d’une version du test de Box et Pierce (1970), corrigée par les degrés de liberté. 
Ce test est valable uniquement dans une équation sans autres variables explicatives que 
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des retards de la variable dépendante. Il permet donc de tester l’autocorrélation du terme 
d’erreur d’une équation particulière d’un système VAR. Il est calculé d’après la formule 


suivante : ; 
* 
(5 ) 


ee 


SO=NN+DI (6.20) 
j=1 


où les coefficients d’autocorrélation empirique des résidus de léquation sont : 


N 
din (er) (e_;) 


Le) = = (6.21) 
2 
> C9 


Le test Q*(s) est de type multiplicateur de Lagrange; il s’agit donc d’un test LM. Sous 
l'hypothèse H, que le terme d’erreur vrai (non observable) de l’équation n’est pas auto- 
corrélé, le test Q*(s) est distribué asymptotiquement selon une Chi-2 à s — p degrés de 
liberté. On rejette donc l’hypothèse d’absence d’autocorrélation du terme d’erreur de 
Péquation si Q*(s) prend une valeur réalisée supérieure à la valeur critique d’une Chi-2 à 
s — p degrés de liberté, au seuil de signification choisi (en général 5 %). 


Test « portmanteau » de Doornik et Hendry [IDOO 1997] 


Il s’agit également d’une version du test de Box et Pierce [BOX 1970], mais que l’on corrige 
par les degrés de liberté en calculant différemment les coefficients d’autocorrélation 
empiriques des résidus. Il est calculé d’après la formule suivante : 

2 


LB(s) = NIN+2)Ÿ° = ; (6.22) 


J=1 


où les coefficients d’autocorrélation empirique des résidus de équation sont : 


N en = 
€ — € €r-j — €; 
D 2. ( Î 0) ( t J ;) 
Tr — 
N N 
e — € > et; — 6; 
bee t 0) | ( t—) ;) 
t=j+1 
N N 
a Du 
ie É ju 7 


N= N=—; 
Le test LB(s) est aussi de type multiplicateur de Lagrange; il s’agit donc d’un test LM. 
Sous l'hypothèse Ho que le terme d’erreur vrai (non observable) de l’équation n’est pas 
autocorrélé, le test LB(s) est distribué asymptotiquement selon une Chi-2 à s — p degrés 
de liberté. On rejette donc l'hypothèse d’absence d’autocorrélation du terme d’erreur de 
Péquation si LB(s) prend une valeur réalisée supérieure à la valeur critique d’une Chi-2 à 
s — p degrés de liberté, au seuil de signification choisi (en général 5 %). 


(6.23) 


avec €p = et €; — 


Test vectoriel « portmanteau » 


Ce test est l'équivalent multivarié du test « portmanteau » développé pour une seule 
équation. Le test vectoriel PB(s) est asymptotique et valable uniquement pour un VAR. Il 
utilise une correction pour de petits échantillons. En notant c; le vecteur w x 1 des résidus 
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estimés de toutes les équations du VAR à la période f, on définit les matrices suivantes, 


pour tout r,s > 0: 
N 


A D Gt 
G-= ON — (6.24) 
où &-; = 0 pour ft — i < 1. Le test vectoriel « portmanteau » est alors défini de la manière 
suivante : , 
St (Gé CHCE ) 
 Coo Co; Coo 
LB(s) = N°? 6.25 
(s) 2 N-; (6.25) 


Il est proposé par Hosking [HOS 1980] et Lütkepohl [LUT 1991] et est implémenté 
par exemple dans PcFiml par Doornik et Hendry [DOO 1997]. Sous l'hypothèse Ho 
d'absence d’autocorrélation des résidus de toutes les équations du VAR(pb), LB(s) est 
distribué asymptotiquement selon une Chi-2 à w2(s — p) degrés de liberté. On rejette 
donc l'hypothèse d'absence d’autocorrélation des termes d’erreur des w équations du 
VAR(p) si LB(s) prend une valeur réalisée supérieure à la valeur critique d’une Chi-2 à 
w?(s — p) degrés de liberté, au seuil de signification choisi (en général 5 %). Le test LB(s) 
est une version avec correction du test vectoriel de Box et Pierce qui est : 


PB =NY #7 (CC CoÉv ) (6.26) 
j=1 


Autres tests 


Pour tester l’hypothèse d’absence d’autocorrélation du terme d’erreur d’une équation 
du VAR, on dispose du test LM habituel d’autocorrélation des résidus. Il repose sur une 
régression auxiliaire des résidus sur les « variables de droite » de l'équation originale et sur 
les valeurs retardées de ces résidus à partir d’une période f—r jusqu’à une période f—s. Sous 
l'hypothèse nulle, Le test est distribué selon une Chi-2 à s—r+1 degrés de liberté. Une valeur 
trop élevée du test implique donc le rejet de l'hypothèse d’absence d’autocorrélation. Ce 
test est valable avec des endogènes retardées, contrairement au test de Durbin et Watson. 


Il est possible de généraliser l'approche précédente en testant globalement l’absence 
d’autocorrélation des termes d’erreur de toutes les équations du système simultanément. 
Ce test est basé sur un système auxiliaire, avec des valeurs retardées de résidus à partir 
d’une période { — r jusqu’à une période { — s. Sous l’hypothèse nulle, la version LM de ce 
test est distribuée selon une Chi-2 à (s — r + 1)n? degrés de liberté. Une approximation F 
du test en question donne de meilleures propriétés sur de petits échantillons. 


On peut utiliser un test de White habituel pour vérifier l'hypothèse d’absence d’hétéros- 
cédasticité du terme d’erreur de chaque équation. 


5.4 MODÈLES VAR ET PROPRIÉTÉ DE COINTÉGRATION 


Avec ou sans racines unitaires, on montre que ®(L) peut se décomposer de la manière 
suivante : 


p-1 
D(L) = D(1)L+(1—L) (. = Das) (6.27) 


1=1 
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(6.28) 


D 
5 DE 2 Vis LS. 


j=H1 


.p—1 


Par conséquent, le système VAR(p), dont la forme originale est D(L)X; = 11 + u;, peut 
encore être reparamétré de la manière suivante : 


p—1 
AX= pu P(DXei + D AIAX- 1 + 
=1 


(6.29) 


Ce reparamétrage est particulièrement utile si des racines unitaires existent, les variables X; 
étant intégrées du même ordre (1). On montre alors que les variables de X sont cointégrées 
et que r vecteurs de cointégration linéairement indépendants existent si le rang de (1) 
est égal à r (< n) et s’il existe des matrices « et B, de type n x retderangr,où0 <r<n, 
telles que D(1) — —af’. Le système VAR(p) peut alors être représenté sous forme de 
mécanisme à correction d’erreur, de la manière suivante : 


p—1 
AX, = + op’X 1 + D AIAX; 1 + 
=1 


(6.30) 


La matrice est la matrice de type n x r dont chaque colonne est un vecteur de cointégration 
différent. Le vecteur B’X;_1, qui a r éléments, est le vecteur des r expressions cointégrées 
qui mesurent chacune un écart par rapport à une relation d’équilibre différente, à la 
période f — 1. Si l’on explicite les matrices, la forme à correction d’erreur précédente est : 


Xi — Xi Hi O1 O2 *** Or Bin Biz **+ ir Xi 
X2% — X2s_1 Ha O21 O22 *** Or Bar Ba *-+ 2, X2-1 
; = + , 
Xnt Xnt 1 Mn fa y2 a, | Br Br ARR Bar X m1 
du A ‘‘* nl Xi — Xi Ur 
1 
? Gui 21 ‘‘' nl X21 — X2_ 11 U 
+ ; , : , > : + 
rar | : ee À : 
An An2 °°"  Annl X m1 = Xnt—1-1 Unt 
et donc: 
Xi — Xi6-1 Mi Ée @12 1 BriXar1 + B21X2s1 + + BuiX ut 
X2r — Xe be O1 O2 BiaX1r1 + B22X25- 1 + + BoXu1 
Xnt — Xnt-1 Mn Uni  n2 BirX1r— + Ba REA EEE Bar Xnt—1 
Gui) 41 ‘‘' Ain Xe — Xp uis 
PTT au a ::: an Xe — Xp Ut 
+3 : +]. 
1 : 
dau An) ‘‘'  Annl Xyt— = X nt 1-1 Unt 
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Le VAR(p) cointégré à correction d’erreur est le système d’équations suivantes pour les #1 
variables : 


Xi — Xi = ui + On (BaiXar1 + Bai X2rr + + + BuiXu1) 

+ O2 (Bi2X arr + B22X 281 + + + BrXy 1) +: 

p-1 

+ Or Bar Xie1 + Bar X 251 + + + Pr 1) +3 au (Xe — X1r-11) 
1=1 

p-1 p-1 

+3 Qui ar — Xi) + +3 Ant Xnt1 — Xnt-11) + Us 


1=1 1=1 
Ko — Xi = Mo + Or (BaiXar1 + Bai X2rr + + + BiXur1) 
+ 022 (B12X 181 + B22X 251 + + + By 1) +. 
p-1 
+ Or (Bart + Bar X 251 + + + PrrÂur1) +3 Qou (Xir1 — X1r-1-1) 
1=1 


p—1 p—1 


+ D an Rai — Xoe) + 2 + D dom Xe — Xi) + 2 
1=1 1=1 


Xnt — Xai1 = Mn + Ont (BuiXus-1 + Ba 21 +: + Br Xr1) 

+ no (Biz Xis-1 + B22X 251 + + ++ + BraX ur) +: 

+ nr (BirX1r-1 + B2rX 261 + + +: + BurXnr-1) 

p—1 p—1 

+ ann arr — Kart) + D ana Os — Nos) +++ 


1=1 = 
1 


p— 
+3 Annl Xi DE Xyr-1-1) + Unr 
1=1 


Avec la notation matricielle, ce long système d’équations s'écrit simplement AX; = pu + 
aB’X;_1+ Se AIAX;_1+u. Toutefois, l’explicitation des matrices facilite l’interprétation 
de leurs coefficients : 

+ La matrice B est telle que chacune des r colonnes est l’un des r vecteurs de cointégration 
linéairement indépendants. 

+ Le produit matriciel B’X;_; est un vecteur dont chacun des r éléments est l’une des r 
relations cointégrées. 

+ Chaque coefficient ;; de la matrice A représente le taux de réaction de la # variable 
à l'écart précédent par rapport à la j° relation d’équilibre. Il s’agit donc bien du 
taux de correction de la variable i suite à l’observation de l'erreur (! précédente, ou 
du déséquilibre précédent, par rapport à la j° relation d’équilibre. D’où le nom de 
mécanisme à correction d'erreur. 

+ Chaque coefficient a; d’une matrice A] représente le taux de réaction de la 5° variable 
à la variation passée, ! périodes auparavant, de la p° variable. 


1. Le mot «erreur » désigne ici une expression cointégrée qui est un écart par rapport à un équilibre. Il a pas 
le même sens que dans l'expression « terme d’erreur », où il est synonyme de « perturbation ». 
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Pour des variables intégrées, cointégration et existence d’un modèle à correction d’erreur 


représentent le même phénomène. En somme, le fait que les variables évoluent selon un 
mécanisme à correction d’erreur permet la cointégration. En effet, dans un tel mécanisme, 
tout écart par rapport à la relation d’équilibre suscite, à la période suivante, une réaction 
visant à réduire cet écart. De cette manière, les variables restent liées à long terme par la 
relation d’équilibre : il y a cointégration entre ces variables. Ce raisonnement permet de 
comprendre le théorème de représentation de Granger, d’après lequel des variables sont 
cointégrées si et seulement si leur évolution conjointe est caractérisée par un modèle à 


correction d’erreur. 
On suppose que toutes les variables de X; sont intégrées d’ordre 1. On montre que la 
cointégration (rang de D(1) = r < n, P(1) = af’, B'X, — 1(0)) implique que: 


t 
Xe = Xo + CD) [ut+ Du] + CHU (6.31) 
j=1 


où 
+ C(L) est le polynôme en l’opérateur de retard L de la représentation de Wold de DX, : 


AX,= CL) (h+w)=h+C(Lu où =C(n 
+ C*(L) est défini par la décomposition suivante de C(L) : 
C(L) = CD) + C'(L)( — L) 


+ C(1) = Bi (a, Y(DB:) a, où «1 et B1 sont des matrices de type n x (n — r) et 
de rang n — r, telles que a ,/a4 = 0 et BB = 0, et où Y(L) = — 4; A;Lj et donc 
Y(D =), À: 

Dans cette égalité, on observe que les variables composant X;, ont une tendance stochas- 

tique 2. u;, ce qui est logique puisque X; est I(1), mais aussi qu’elles ont une tendance 

déterministe f, sauf si C(1}u = 0. On en tire les remarques suivantes : 

+ Si les variables X;; composant X, ont une racine unitaire avec dérive, on sait qu’elles 
ont effectivement une tendance déterministe, en plus de la tendance stochastique (voir 
chapitre 5). Il est alors logique de laisser 1 sans restriction, de ne pas imposer C(1)4 = 0. 

+ Si les variables X; composant X, ont une racine unitaire sans dérive, on sait qu’elles 
n'ont qu'une tendance stochastique et pas de tendance déterministe (voir chapitre 5). 
Il est alors logique d’imposer que C(1)u = 0. 

En pratique, si l’on étudie n variables X;; qui n’ont pas visuellement de tendance croissante 

ou décroissante, il est approprié d’imposer la contrainte C(1}14 = 0. On montre que cela 

revient à imposer le vecteur |L comme une combinaison linéaire des colonnes de ao. 


EH Tests de cointégration de Johansen 


6.1 PRINCIPE 


Les tests de Johansen permettent de vérifier des hypothèses sur le nombre de vecteurs de 
cointégration dans un système VAR(p) reliant des variables qui sont toutes intégrées du 
même ordre. 
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On part d’un vecteur X, (rassemblant n variables) dont l’évolution est décrite par un 
modèle VAR(p) du type : 


p 


s—1l 
X; = + > PIX; (+ De.) + us (6.32) 
i=1 


I=1 


On peut le reparamétrer ainsi : 


p—1 s—1 
AX;= pu — P(1)Xe 1 + ŸAAX, DE b va) + us (6.33) 
1=1 i=1 
avec : 
P 
A=-N VI=1,2,...p—1 (6.34) 
j=lH1 
D 
(= D d (6.35) 
j=Hi 


Les variables Q;; sont d'éventuelles variables indicatrices (ou dummy), saisonnières (voir 
chapitre 3), s représentant la fréquence des données (12 pour des données mensuelles 
par exemple). On peut rarement ajouter une tendance linéaire t. On suppose que u, 
N,(0, >) et que les u, de périodes différentes sont indépendants. On suppose aussi que 
X; = I(1), donc que toutes les variables sont intégrées d’ordre 1. Sous l'hypothèse de 
normalité de u, la méthode de Johansen permet de tester l'hypothèse de l’existence d’un 
effectif r quelconque de relations cointégrées, allant de 0 à n — 1. 
Johansen montre que les estimateurs de maximum de vraisemblance des paramètres 
d’un modèle VAR cointégré sont fonction de quelques matrices assemblées à partir des 
résultats de estimation de régressions auxiliaires par MCO. Pour appliquer la méthode de 
Johansen, on réalise donc d’abord l’estimation par MCO du système d’équations linéaires 
suivant : 
s—1 
AX3 1 = Co + Co AX 1 + 2: + Cop-1 AXE pr + D sa.) + Ror (6.36) 
i=1 
où C9 est une matrice de type m x 1, chaque Ci; est de type m x m et Ro, est un vecteur 
de m résidus au temps f. 
On réalise également l’estimation par MCO du système d’équations linéaires suivant : 
s—1 
Xi = Ci + Ci AXE + + Cp AXE p 1 + D se.) + Ri (6.37) 
i=1 

où C, est une matrice de type n x 1, chaque C;; est de type n x net R1; est un vecteur de 
m résidus au temps f. 


On utilise alors les vecteurs Ro, et R1, de résidus calculés pour former les matrices Soi, Soo; 
So et S11, de type N x N, de la manière suivante : 


N 
1 
Sÿ = (5) ŸRR, (6.38) 
t=1 


où N est l'effectif des observations disponibles (les variables X; sont observées sur N 
périodes). 
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Pourquoi tous ces calculs préliminaires? On montre aisément que la fonction de vraisem- 


blance du système VAR(p) avec D(1) — —af' est maximisée si l’on choisit les estimateurs : 
ÊMV = So — Sub (B'Su1B) B'So (6.39) 
EM = Su (BSu8) (6.40) 


À ce stade, ces estimateurs sont fonction de B, qui est lui-même une matrice de paramètres 

inconnus qu’il faut estimer. Si l’on a un estimateur de maximum de vraisemblance pour B, 

il suffit de le remplacer dans les formules précédentes pour disposer des estimateurs de 

maximum de vraisemblance de X et a. 

La fonction de vraisemblance du système VAR(p) avec D(1) = af, où a etBontr 

colonnes et un rang r, est maximisée si l’on choisit BMV — (O1, V2, , D), où O1, Da, , On 
. 


sont les vecteurs propres associés aux n valeurs propres À, \2,...,X, dont le vecteur 


KR À 2 _ ! 
À = ( À...) hi) est solution du système d’équations suivant : 


EST — S10S50 Soi 


= 0 (6.41) 


Elles sont classées par ordre décroissant : k1 > À2 > ::- > À,. Les vecteurs propres 
Di, D, , V Sont normalisés de manière à ce que leur matrice V — (51,02,...,Ÿ,), de 
type n x n, vérifie : 

1, — V'SiV (6.42) 
Les r vecteurs cointégrants estimés, donc les r colonnes de BMV, sont ainsi les r premiers 
vecteurs propres (les vecteurs associés aux r plus grandes valeurs propres parmi les n 
valeurs propres), parmi les n vecteurs propres existants. (Les r vecteurs de cointégration 
sont les r vecteurs propres les plus significatifs parmi les m vecteurs propres.) 


Ces calculs d’estimateurs sont bien sûr conditionnels au choix d’un rang r. Lequel choisir ? 
Pour déterminer le rang r de cointégration, Johansen propose deux tests : 


n A 
a) Le test de la trace, LR(r|n) = —N D. ” In(1 — X;), permet de vérifier l’hypo- 
* 
thèse Hh : rang de B = r (r vecteurs cointégrants linéairement indépendants) contre 
Phypothèse H : rang de $ = n (n vecteurs cointégrants linéairement indépendants). 
Sous l'hypothèse H5, ce test a une distribution particulière, tabulée par Johansen. 


b) Le test de la plus grande valeur propre, LR(r|n) = —N In(1 — LE permet de vérifier 
Phypothèse H, : rang de B = r (r vecteurs cointégrants linéairement indépendants) 
contre l'hypothèse H1 : rang de B = r + 1 (r + 1 vecteurs cointégrants linéairement 
indépendants). Sous l’hypothèse H,, ce test a une distribution particulière tabulée par 
Johansen. 


Ces deux outils sont valables lorsque 11 est laissé sans restriction, ce qui permet à X, d’avoir 
une tendance linéaire. Ils se déclinent en d’autres versions : 


+ On peut imposer a priori que a, = 0, c’est-à-dire qu’il existe un vecteur Bo de type 
r x 1 tel que 1 = ao; sous les mêmes hypothèses Ho précédentes, les tests ont des 
distributions particulières tabulées par Johansen. 


+ On peut également imposer que 4 = 0. 


+ On peut ajouter une tendance linéaire dans le modèle et en contraindre le coefficient 
pour éviter que les variables de X, aient une tendance quadratique. 
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Remarque 


Le test de la trace a souvent des distorsions de niveau ou de seuil : l'hypothèse H, d'absence 
de cointégration (r — 0}, ou bien l'hypothèse Ho d'une autre valeur de r, est souvent erroné- 
ment rejetée, alors qu'elle est vraie, en faveur de l'hypothèse H; d'un r supérieur. Tel qu'il 
est programmé dans TSP, le test de la trace incorpore une correction de petits échantillons 
proposée par Gregory [GRE 1994]. 


Avec TSP, les probabilités critiques |p-values) des tests de Johansen sont obtenues par inter- 
polation à partir des tables d'Osterwald-Lenum [OST 1992]. 


6.2 IDENTIFICATION DES VECTEURS DE COINTÉGRATION 


La technique d’estimation de Johansen permet donc d’obtenir r vecteurs de cointégra- 
tion estimés, mais qui ne sont pas identifiés puisque toute combinaison linéaire de ces 
vecteurs estimés peut aussi être considérée comme un vecteur de cointégration. Pour les 
identifier, il faut imposer des restrictions de normalisation et des restrictions supplémentaires 


d'identification. Il s’agit de choisir des vecteurs B,,B...B, particuliers (qui sont les 


colonnes d’une matrice À) parmi Pinfinité de vecteurs définis comme des combinaisons 
linéaires des vecteurs estimés Br, B>.. $, (qui sont les colonnes d’une matrice ). 


Les restrictions de normalisation sont : 


Bi=1 Vi=1,...,r (6.43) 


Les restrictions supplémentaires d’identification peuvent être imposées, en même temps 
que les précédentes, de la manière suivante () : 


D 2 fuel 
Ê= 8 (c8) (6.44) 
où c est une matrice n x r de coefficients dont les valeurs sont fixées arbitrairement 


en fonction des restrictions qu'on veut imposer. Par exemple, si l’on veut imposer que 
les r premières variables n’interviennent chacune que dans une seule des r relations de 


cointégration, on choisit (2) : 
L 
el (6.45) 
O 
1. On impose en fait les restrictions c” Ê = I. 
1 0 0 0 
0 1 0 0 
2. I, est la matrice identité à r lignes et r colonnes : I, = 5 PE nes , tandis que O est une 
0 0 1 0 
0 0 0 1 
0 0 
matrice (n — r) x r qui ne contient que des 0 : O — : 
0 0 
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On obtient une matrice de cette forme : 


1 0 0 0 
0 0 0 
FT 0 0 Fr 1 0 
= 6.46 
P 0 0 +. 0 1 
Bo+n1 Bo+1)2 ME Bo+1çr-1) Ber+1yr 
B,1 B,2 4 Pat Be 


Dans ces conditions, la méthode d’Engle et Granger, si elle n’est appliquée que sur un sous- 
ensemble de n + 1 — r variables (1) parmi les n variables intégrées, est une technique qui 
permet d'emblée d’estimer isolément l’une des r relations de cointégration normalisées 
et restreintes. 


B=B(c8) (6.47) 


Exemple 


Soient n variables 1(1) cointégrées et deux vecteurs de cointégration linéairement indépendants 
{r = 2] estimés : 


Ên Bi 
Bai B22 
: et ' 
Br Bn2 
Ils forment la matrice : 
Bu Bn 
À Bar Ba 
B= |. 
Bu Br2 
Si l’on définit la matrice c par... 
1 0 
0 1! 
220 00 
0 0 


1. Une seule parmi les r premières et toutes les n — r dernières. 
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… on obtient : 
Pur Bu | 
TT e Bai Ba Br Bu 
B = (ch) : : ë * 
Br Br 
Bu Br Bu Br 
Br Ba Bu Ên ne Ba Po 1 bn  —Bn 
| : (i" pe) | | Gr = a) É. Bu | 
Br Bn Br Bn2 
1 0 
0 1 


(B: B22 a B32È2 ) (682 + Puôu) 
B22 ” B12È2 ) (Bu LE Bizba) 


Il 
PTS, 
TD> 
= 


(B B22 - B2B2 ) (Bb e Przôu) 
(B: B22 — Piaf ) (Bu œ izba) 


Les nouveaux vecteurs , (première colonne de À] et , (deuxième colonne de Ê] ainsi obtenus 

sont bien des combinaisons linéaires des vecteurs B: et B> initiaux : 

B22 à Br à 
B 


Fume) (chi) 


TD)? 


Modèles à correction d’erreur conditionnel 


Le vecteur u, des termes d’erreur du système dynamique cointégré est supposé non 
autocorrélé et distribué d’après une normale, de matrice de variance et de covariance Y 
c’est-à-dire : u, + N (0, 2). Il en résulte la distribution conditionnelle (1) suivante de AX, 
par rapport à « son passé » : 


AX, Xi Xe... Nu + aB’X;1 + A1AX; 1, 2) (6.48) 
”_ Y; : 
On partitionne le vecteur X, en X, — 2 l où Y, est un vecteur m x 1 et Z; un vecteur 
in 
(n— m) x 1: 
x, X (+11 
X (+21 
Y, = : , Z= | (6.49) 
X 
mt Len 


1. Pour quelques rappels sur la notion de distribution conditionnelle, on peut se référer à tout bon manuel 
de statistique de base, comme par exemple celui de Patrick Roger, Probabilités, statistique et processus 
stochastiques, publié chez Pearson Education France dans la même collection. 
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On partitionne de même le vecteur |4 et la matrice Y : 


Mm+1 


jh n Zu E 
1 . 2 m+2 11 12 
M — : » M — : », 2= (6.50) 
: Zu Zn 
Mn 
Mn 
où 
O11 ‘°°  Oïim Oï(m+1)  Ol(m+2) ‘‘"  Oin 
Eu = Lo 7e, : » Zn = : On |? 
Om ‘‘'" Omm Om(m+1)  Om(m2) ‘°°  Omn 
OGm+1)1 ‘°°  O(m+l)m Om+1)(m+1)  O(m+l)(m+2)  ‘°"  O(m+l)n 
Om+132 ‘°°  O(m+l)m O(m+2)(m+1)  O(m+2)(m+2)  ‘"  O(m+2}n 
Zn = . et Zn — 
Om+192 ‘‘'  O(m+1)2 On(m+1) On(m+2) He Onn 


On partitionne également les matrices à et A; : 


où o, est une matrice m x r contenant les m premières lignes de @, et &2 est une matrice 
(n — m) x r contenant les (n — m) dernières lignes de a. 


où A, est une matrice m x n avec les m premières lignes de À, et A, est une matrice 
(n — m) x n avec les n — m dernières lignes de À. 
L'hypothèse de normalité évoquée précédemment permet de déduire la distribution condi- 


tionnelle de AY; conditionnellement à Z; et au passé de X, et la distribution marginale 
de AZ, : 


AY; 12, X5-1, Xe 2 .. 


enN(" + 202» (AZ — bo) + (ou — 212 23 0) B'X;-1 + (An — Zn 2» An) AX;-: 
Eu — 222» Du 


(6.51) 
AZ+|Zr-1,Zr2... ON (lu + oB'X5-1 + An AX; 1, Z2) (6.52) 
On écrit encore : 
AY, = (lu _ 2122» M) + (Zn2») AZ; + (ou — Z122> 0) B'X;_: 
+ (An — 2122» An) AXy-1 + Wir (6.53) 
AZy = po + Of X5-1 + An AX;- 1 + (6.54) 


\ rl —1,2 
OÙ Ui.2 = Uy — DD ui. 
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La première équation matricielle (6.53) est un modèle à correction d’erreur conditionnel en 
forme réduite tandis que la deuxième (6.54) est un modèle à correction d'erreur marginal 
[BOS 1992]. L'une et l’autre sont un simple reparamétrage du système VAR cointégré 
original. Elles contiennent donc la même information, mais présentée différemment. 
(lu — 2 23 lb) et 12, sont des vecteurs mn x 1, Z12 = est une matrice m x (n — m), 
(on — Zn Z3 ) est une matrice m x m, B'X;-_1 est un vecteur mx 1, (ou — Zn Z w) 6 
est une matrice m X n, et (Au — Zn 23 An) une matrice m X n. 


E Modélisation structurelle 


Après avoir défini un modèle VAR à correction d’erreur conditionnel, il est intéressant 
de définir un modèle structurel faisant apparaître des interactions entre les variables 
d'intérêt (celles de Y) contemporaines. L'avantage d’une telle modélisation est donc que 
les variables contemporaines d'intérêt sont incluses dans l’équation, ce qui n’était pas le 
cas auparavant. 


En reparamétrant le modèle à correction d’erreur conditionnel en forme réduite, on peut 
spécifier différents modèles structurels, en particulier un modèle structurel à équations 
simultanées à correction d’erreur. 


On partitionne la matrice $' de la manière suivante : $' = (rs), où l'est supposé être 
une matrice non singulière m x m et B est une matrice m x (n — m), ce qui induit : 


B'X;, —= rY, + BZ; —= V+ (6.55) 


L'introduction d’une partition de la matrice B en deux matrices T et B permet simplement 
de réinterpréter les relations de cointégration dans une perspective de modèle structurel 
reliant des variables endogènes Y à des variables exogènes Z. Le vecteur m x 1v, est ainsi 
défini comme le vecteur des écarts aux équilibres à la période t. 


Les matrices | et B ne sont identifiées que moyennant des hypothèses d’identification, 
décrites par Park [PAR 1990] et Saikkonen [SAI 1991]. Ces matrices n'étant qu’une 
partition de f, les hypothèses d'identification exacte de f examinées précédemment valent 
aussi pour let B, et avec la nouvelle notation de $ partitionné en F et B, elles peuvent 
s’écrire de la manière suivante (1) : 


! 
Fi = —1,i= 1...mpourles hypothèses de normalisation et R; (rin) =0,i-=1...m 
pour les hypothèses supplémentaires d’identification exacte. 


! 


Le vecteur (ris) est la colonne de 6. Chaque matrice de restrictions R; doit être 


d’ordre (r— 1) x net de rang r — 1 : un vecteur de cointégration particulier est exactement 
identifié si, en plus de la restriction de normalisation, on lui impose r — 1 restrictions 
linéairement indépendantes. 


Bien entendu, on peut également imposer, en plus des restrictions de normalisation et des 
restrictions supplémentaires d’identification exacte, des restrictions supplémentaires de 
suridentification. C’est le cas ici si une ou plusieurs matrices R; ont plus de r — 1 lignes et 
sont d’un rang supérieur à r — 1. Seules les restrictions de suridentification peuvent être 
testées statistiquement. 


1. En l’absence de restrictions « interéquations » qui seraient une autre manière d’identifier les coefficients. 
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Un modèle structurel à correction d’erreur peut s’obtenir simplement par reparamétrage 


du modèle à correction d’erreur conditionnel en forme réduite : on substitue | TB | à B 
et l’on multiplie l’ensemble par une matrice non singulière m x m notée l: 
LoAY: = lo (li — E2È23 ba) + lo (Zn) AZ 
+ To (ou DE Z122» 0) Ye: + BZ5-1) 
+ To (An — 21223 An) AXe1 + lou (6.56) 


Le nouveau vecteur de termes d’erreur &; — low a une matrice de variance et de 
covariance à — M (Eu ou D Za1) Fe 


Le modèle structurel peut alors être noté de manière plus simple : 


FoAŸ; = b+ BoAZ; + A (TŸ1 + BZs-1) + MAY 1 + BiAZs 1 + E; (6.57) 
moyennant les définitions suivantes : 


b=r (lu — 2122» M2) » Bo = To (Z2%) », A=T (ou L 2122 0) 


où (TB) = Fou - Se E3l) 


Ces nouvelles notations sont des matrices dont les éléments sont notés ainsi : 


Vo,ii ‘°°  Yo,im bi bou *** boim 
Yo,m1 pi YO,mm bn Domi V4 Domm 
ui im 
ni nm 
Vi  °t  Yiml Dur bir :*: biçn-m1 
Fi = : 7. : » Bi = : : : 
YmL,1 tt Ymm,l by by CH bynçn—m),1 


NS Z42 


Le problème de l'identification de T et B ayant déjà été traité, il faut encore aborder 
celui de l'identification des paramètres restants : | T1:B1) = lo (oi — Z12233 on). Il 


s’agit des paramètres décrivant les ajustements à court terme (T° et B étant les paramètres 
des relations d’équilibre à long terme). À nouveau, il faut imposer des restrictions de 
normalisation et des restrictions supplémentaires d’identification, inspirées si possible 
par la théorie économique. Les restrictions de normalisation peuvent s'exprimer de la 
manière suivante : 

F;=1,i=1...m (6.58) 


La sélection de restrictions supplémentaires d'identification sur les paramètres à court 
terme est difficile, car les propositions dégagées par la théorie économique portent essen- 


tiellement sur les relations d’équilibre et expliquent généralement peu les ajustements à 
court terme. 
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Il serait donc raisonnable de commencer par des restrictions d’identification exacte 
théoriquement plausibles, et d'appliquer éventuellement ensuite, au vu des résultats, 
des restrictions supplémentaires de suridentification « testables ». On applique ici la 
méthodologie proposée initialement par Boswijk [BOS 1992], qui suggère de faire les 
restrictions d'identification exacte (1) qui contraignent la matrice A à être diagonale : 


Au O0 0 
À = 0 0 (6.59) 
0 O mm 


Pour chacune des m équations, on impose donc m — 1 restrictions sur les coefficients, en 
l'occurrence des restrictions de nullité. Avec la restriction de normalisation, on dispose 
bien de m restrictions, qui permettent l'identification exacte. 


Résumé 


Les tests de cointégration permettent de vérifier l’existence d’une relation 
d'équilibre à long terme entre des variables intégrées. Des variables cointégrées 
suivent alors une dynamique à correction d’erreur autour de cette relation 

’équilibre. La méthode de test de cointégration la plus simple est celle d’'Engle 
et Granger, qui suppose implicitement qu'un seul vecteur cointégrant relie 
les variables. Même en cas de cointégration, les estimateurs de MCO des 
coefficients cointégrants ne suivent pas l’inférence statistique classique. Tou- 
tefois, des estimateurs modifiés la suivent. La méthode de Johansen permet de 
tester l’hypothèse de l'existence de plusieurs vecteurs cointégrants entre des 
variables intégrées, dont la dynamique est représentée par un modèle VAR. Un 
modèle VAR cointégré à correction d’erreur reliant un ensemble de variables 
intégrées permet d'obtenir un modèle VAR conditionnel en correction d’erreur, 
pour un sous-ensemble des variables dont on veut représenter la dynamique 
conditionnellement aux valeurs passées et courantes des autres variables. Pour 
ce même sous-ensemble de variables, on peut également obtenir un modèle 
structurel à correction d’erreur capable de représenter les relations contem- 
poraines simultanées reliant ces variables entre elles, tout en représentant leur 
dépendance par rapport à leurs valeurs passées, et conditionnellement aux 
autres variables. 


1. Cela ne revient pas ici à imposer sur la # relation à court terme les mêmes restrictions que celles appliquées 
à la 5° relation d'équilibre, alors que c’est Le cas dans l’application de Boswijk. 
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Problèmes 
ef exercices 


EXERCICE 1] ASSURANCE ET TEST D'ENGLE ET GRANGER 


Énoncé 


On souhaite expliquer l’évolution temporelle de la série observée du total annuel des 
primes d’assurance collectées par Les sociétés françaises d’assurance en dommages de 1965 
à 1999. Les modèles financiers suggèrent que ces primes doivent être une fonction négative 
du taux d’intérêt. En effet, les assureurs collectent les primes, puis les utilisent partiellement 
pour payer les sinistres des assurés ; entre-temps, ils les placent (en obligations...) : plus 
le taux d’intérêt est élevé, plus le profit financier est élevé, et donc plus faibles peuvent 
être les primes par rapport à la valeur espérée des sinistres à indemniser. Selon un même 
raisonnement, on pourrait avancer que les primes sont une fonction négative du taux de 
rendement boursier, ou du temps moyen entre la perception des primes et le paiement 
éventuel d’indemnités : plus ce temps est long, plus les placements rapportent des intérêts, 
et donc plus faibles peuvent être les primes exigées par les assureurs. Ce temps est appelé 
« longueur de branche ». Le raisonnement économique suggère aussi que les primes 
sont une fonction positive du taux d'inflation : en cas d'augmentation de celui-ci, les 
indemnités de sinistres coûtent plus cher et donc les primes exigées augmentent. Elles 
devraient également augmenter avec le montant observé des sinistres à indemniser et avec 
les dépenses de gestion des sociétés d'assurance. Elles devraient diminuer avec le niveau 
du capital des sociétés d'assurance : plus celui-ci est élevé, plus les sociétés d'assurance 
sont solvables et donc plus elles peuvent prendre le risque de diminuer les primes pour 
attirer de nouveaux clients. Tout cela suggère qu’à long terme, on a une relation du type: 


In(primes) = 11 + B2 taux d’intérêt + B; In(indice boursier) + 84 In(sinistres) 
+ B5 In(dépenses) + Bç In(capital) + B;longueur + Bsinflation + u 


On vérifie par des tests de racine unitaire que toutes les variables ont une racine unitaire 
et sont intégrées d'ordre 1. Si cette relation est vraie dans la réalité, elle implique donc une 
cointésration entre primes en logarithmes, taux d’intérêt, indice boursier en logarithmes, 
sinistres en logarithmes, dépenses en logarithmes, capital en logarithmes, longueur et 
inflation. C’est ce qu’il faut vérifier sur les données observées de la réalité, en travaillant 
avec TSP. Le fichier Excel assur.xls téléchargeable sur le site www.pearsoneducation.fr 
contient les séries observées suivantes : 


Primesem : les primes nominales totales ; 


Obl : le taux d'intérêt nominal sur les obligations ; 
Cac: l'indice boursier nominal; 

Sini : les sinistres nominaux totaux ; 

Dep: les dépenses nominales de gestion ; 
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Cp: le capital nominal des sociétés d’assurance ; 
K : la longueur moyenne des branches ; 
Inf: le taux d'inflation. 


Ce fichier est constitué de manière à pouvoir être lu par TSP (voir chapitre 2). 


Solution Pour réaliser le test de cointégration, il faut donner au logiciel TSP les instructions 
suivantes : 
freq à; 


smpl 1963 1999; 
read(file=‘assur.xls’); 
sin=log(sini); 
primesem=log(primesem) ; 
dep=log(dep); 
cp=log(cp): 
cac=log(cac); 


? 
? tests engle granger de cointégration 65-99 
? 
smpl 1965 1999; 

regopt(pvprint, Imlags=2, qlags=2) all; 
regopt(noprint) @vcov @vcor; 

noplots; 

olsq Iprimesem c obl Icac Isin ldep Icp k inf; 
res=@res; 

smpl 1966 1999; 

dres=res-res(-1); 

smpl 1967 1999; 

olsq dres res(-1l); 

cdf(dickeyf, nvar=6, constant ,notrend) @t(1); 
olsq dres res(-1) dres(-1); 
cdf(dickeyf,nvar=6,constant ,notrend) @t(1): 


Les résultats sont les suivants : 


Equation 1 


Method of estimation = Ordinary Least Squares 


Dependent variable: LPRIMESE 
Current sample: 1965 to 1999 
Number of observations: 35 


Mean of dependent variable = 11.3867 

Std. dev. of dependent var. = .995474 

Sum of squared residuals = .035663 
Variance of residuals = .132083E-02 

Std. error of regression = .036343 

R-squared = .998947 
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Adjusted R-squared = .998667 

Durbin-Watson statistic = .7/757481 
Breusch/Godfrey LM: AR/MAI = 18.0745 [.000] 
Breusch/Godfrey LM: AR/MA2 = 22.6673 [.000] 
Ljung-Box Q-statisticl = 12.6601 [.000] 
Ljung-Box Q-statistic2 = 12.6663 [.002] 
Wald nonlin. ARI vs. lags = 12.3197 [.091] 
ARCH test = 2.26463 [.132] 
CuSum test = .376031 [.994] 
CuSumSq test = .466986 [.001] 
Chow test = 8.25112 [.000] 
LR het. test (w/ Chow) = 42,5555 [.000] 


Jarque-Bera normality test = .537588 [.764] 
F-statistic (zero slopes) = 3640.26 [.000] 
Akaike Information Crit. = -3.59398 

Schwarz Bayes. Info. Crit. = -6.07635 


Log of likelihood function = 70.8947 


Estimated Standard 


Variable Coefficient Error t-statistic P-value 
C 1.30534 .254761 5.12379 [.000] 
OBL .366363E-02 .662020F-02 .553402 [.585] 
LCAC -.031730 .050854 -.623944 [.538] 
LSIN -./77358E-02 .085036 -.091416 [.928] 
LDEP .937596 .109216 8.58475 [.000] 
LCP .026854 .068117 .394238 [.697] 
K .280884 .130808 2.14729 [.041] 
INF -.343361E-02 .465784E-02 -./37168 [.467] 


Current sample: 1966 to 1999 


Current sample: 1967 to 1999 


Equation 2 


Method of estimation = Ordinary Least Squares 


Dependent variable: DRES 
Current sample: 1967 to 1999 
Number of observations: 33 


Mean of dependent variable = .122208E-02 
Std. dev. of dependent var. = .028996 
Sum of squared residuals = .020384 
Variance of residuals = .63/005E-03 
Std. error of regression = .025239 
R-squared = .247712 


Adjusted R-squared = .247712 

Durbin-Watson statistic = 1.1/7865 
Breusch/Godfrey LM: AR/MAI = 13.1137 [.000] 
Breusch/Godfrey LM: AR/MA2 = 10.1149 [.006] 
Ljung-Box Q-statisticl = 4.37589 [.0361] 
Ljung-Box Q-statistic2 = 4.62909 [.0991 
ARCH test = 1.40935 [.235] 
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CuSum test = .599497 [.417] 
CuSumSq test = .223404 [.203] 
Chow test = .172019 [.681] 
LR het. test (w/ Chow) = -.817481 [1.00] 
White het. test = 0. [1.00] 
Jarque-Bera normality test = .095288 [.953] 
Akaîike Information Crit. = -4.49102 
Schwarz Bayes. Info. Crit. = -7.28355 
Log of likelihood function = 75.1019 
Estimated Standard 
Variable Coefficient Error t-statistic P-value 
RES(-1) -.449767 .140060 -3.21124 [.003] 


DICKEY-FULLER(C,ASY.,6) Test Statistic: -3.211236, Lower tail area: 


Equation 3 


Method of estimation = Ordinary Least Squares 


Dependent variable: DRES 
Current sample: 1967 to 1999 
Number of observations: 33 


Mean of dependent variable = .122208E-02 
Std. dev. of dependent var. = .028996 
Sum of squared residuals = .013656 
Variance of residuals = .440512E-03 
Std. error of regression = .020988 
R-squared = .500584 
Adjusted R-squared = .484474 
Durbin-Watson statistic = 1.942712 


Durbin’s h = -.550791 [.582] 
Durbin’s h alternative = -.745214 [.456] 
Breusch/Godfrey LM: AR/MAI = .555344 [.456] 
Breusch/Godfrey LM: AR/MA2 = 1.126597 [.570] 
Ljung-Box Q-statisticl = .072370 [.788] 
Ljung-Box Q-statistic2 = 1.36287 [.506] 
ARCH test = .144538 [.704] 
CuSum test = .697415 [.253] 
CuSumSq test = .17/79523 [.425] 
Chow test = .4217/788 T.660] 
LR het. test (w/ Chow) = -1.22798 [1.00] 
White het. test = 0. [1.00] 
Jarque-Bera normality test = .945372 [.623] 
F-statistic (zero slopes) = 30.07/736 [.000] 
Akaîike Information Crit. = -4,83100 
Schwarz Bayes. nfo. Crit. = -7.57818 


Log of likelihood function = 81.7115 


Estimated Standard 


Variable Coefficient Error t-statistic P-value 
RESC-1) -.672522 .129671 -5.18638 [.000] 
DRES(-1) .584632 .149592 3.90816 [.000] 


DICKEY-FULLER(C,ASY.,6) Test Statistic : -5.186382, Lower tail area: 
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.63399 


.01221 


cheste 


Les résultats présentés sous le titre « equation 1 » sont produits par l'instruction 
olsq Iprimesem c obl Icac 1sin 1dep 1cp k inf;.Les coefficients estimés four- 
nissent donc une estimation du vecteur de cointégration (les B;) entre 1primesemet ob1, 
Icac, 1sin, dep, 1cp, k, et inf, en cas de réelle cointégration entre ces variables. Pour 
le vérifier, il faut tester si le résidu de la régression linéaire est stationnaire, c’est-à-dire si 
lon rejette l'hypothèse que ce résidu a une racine de valeur 1. 


C’est la raison pour laquelle on définit une variable res égale au résidu de la régression, au 
moyen de linstruction res=@res. En effet, après avoir calculé une régression par MCO, le 
logiciel TSP garde automatiquement en mémoire la série des résidus sous le nom de@res. 
Ici, on renomme cette série en l’appelant res. Ensuite, on calcule sa variation, appelée 
dres, au moyen de l'instruction dres=res-res(-1). 


Les résultats présentés sous le titre « equation 2 » sont produits par l'instruction o1sq 
dres res(-1).Elle calcule par MCO la régression de base sur laquelle se fonde le test DF. 
Il correspond à la f-stat du coefficient de la variable res (-1) dans cette régression, soit à la 
valeur de @t(1). Après avoir calculé une régression par MCO, le logiciel TSP garde auto- 
matiquement en mémoire le vecteur des f-stats sous le nom de @t. Le premier élément de 
ce vecteur est@t (1), le deuxième@t (2), etc. La t-stat du coefficient de la variable res(-1) 
est le premier élément de @res, soit @t(1). Il faut comparer cette valeur à une table de 
Dickey et Fuller pour déterminer si l’on rejette ou non lhypothèse de racine unitaire 
pour la variable res. L'instruction cdf(dickeyf,nvar=6,constant ,notrend) @t(1) 
se charge de l’opération. L’argument dickeyf compare @t(1) à une table adéquate 
de Dickey et Fuller. L’argument nvar=6 utilise la table valable pour une relation 
entre six variables (on ne dispose pas de table du test pour huit variables, six étant 
le maximum existant). Les arguments constant et notrend indiquent la présence 
d’une constante et l’absence de tendance déterministe dans léquation. Le résultat 
de cdf(dickeyf,nvar=6,constant ,notrend) @t(1); est la ligne : db DICKEY- 
FULLER(C,ASY.,6) Test Statistic: -3.211236, Lower tail area: .63399 


Le test DF est —3.211236. Puisque la probabilité critique est .63399, soit une valeur 
supérieure à 0,05, et même à 0,10, on ne rejette pas l’hypothèse de racine unitaire pour la 
variable res aux seuils de signification de 5 % et de 10 %, d’après ce test. Toutefois, on ne 
sait pas encore si le test DF est fiable ou s’il faut plutôt s’en remettre à un test ADF. 


Les résultats présentés sous le titre « equation 3 » sont produits par l’instruction o1sq 
dres res(-1) dres(-1).Elle calcule par MCO la régression de base sur laquelle se fonde 
le test ADF(1). Il correspond à la t-stat du coefficient de la variable res(-1),soità@t(1). 
Il faut de nouveau comparer cette valeur à une table de Dickey et Fuller pour déterminer 
si l’on rejette ou non l’hypothèse de racine unitaire pour la variable res. L’instruction 
cdf(dickeyf,nvar=6,constant ,notrend) @t(1) se charge de l’opération et produit 
comme résultat la ligne : 


DICKEY-FULLER(C,ASY.,6) Test Statistic : -5.186382, Lower tail area : .01221 


Le test ADF(1) est —5.186382. Puisque la probabilité critique est .01221, soit une valeur 
inférieure à 0,05, on rejette l'hypothèse de racine unitaire au seuil de signification de 5 %, 
d’après ce test. 

Il faut se fier au test ADF(1) plutôt qu’au test DF. En effet, le logarithme de la fonction 
de vraisemblance est 81.7115, contre 75.1019 précédemment. Le test du rapport de 
vraisemblance, 2(In(Li) — In(Lo)) = 2(81.7115 — 75.1019), est supérieur à la valeur 
critique d’une Chi-2 à 1 degré de liberté : on rejette donc la spécification sans la variable 
dres(-1) au profit de celle qui linclut. La probabilité critique .000 de la f-stat du 
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coefficient de dres(-1) est d’ailleurs inférieure à 0,05 et implique donc que le coefficient 
de dres(-1) n’est pas 0. Il faut ajouter la variable dres(-1) pour que le terme d’erreur 
de la régression auxiliaire sur le résidu soit un bruit blanc. En effet, dans l’équation du 
test DF qui n’inclut pas dres(-1), les probabilités critiques des tests d’autocorrélation 
« Breusch/Godfrey LM » et « Ljung-Box Q-statistic » sont toutes inférieures à 0,05 : 
on rejette donc l'hypothèse d’absence d’autocorrélation. Par contre, dans l’équation du 
test ADF(1) qui inclut la variable dres(-1),ces mêmes probabilités critiques sont toutes 
supérieures à 0,05 : on ne rejette pas l'hypothèse en question. Un autre argument en 
faveur du test ADF(1) est que le critère d’Akaïike de l’équation du test ADF(1) qui inclut 
la variable dres(-1) (—4.83100) prend une valeur supérieure à celle du même critère 
(—4.49102) de l’équation du test DF qui n’inclut pas dres(-1). 


Puisqu’on doit se fier au test ADF(1), et que celui-ci indique que la variable res n’a pas 
de racine unitaire, donc qu’elle est stationnaire, on conclut à une cointégration entre les 
variables. 


Le logiciel TSP est capable de réaliser les tests précédents. Les instructions à lui faire 
exécuter sont les suivantes : 


freq à; 

smpl 1963 1999; 
read(file=‘assur.x1s’); 
Isin=log(sini); 
Iprimesem=log(primesem); 
Tdep=log(dep); 
Tcp=log(cp); 
Icac=log(cac); 

? 


? tests engle granger de cointégration 65-99 
? 
smpl 1965 1999; 
coint(eg,nojoh,maxlag=1,constant ,notrend) 
Tprimesem obl Icac Isin Idep lcp K inf; 


Les résultats sont les suivants : 


Current sample: 1963 to 1999 
Current sample: 1965 to 1999 


Engle-Granger (tau) cointegration tests 


Variables: LPRIMESEM OBL LCAC LSIN LDEP LCP K INF 


Dependent variable: LPRIMESEM 


Num lags 0 1 Opt:1 
alpha 0.55023 0.32748 0.32748 
TestStat -3.21124 -5.18638 -5.18638 
P-value ; ; : 

Const 1.30534 1.30534 1.30534 
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EXERCICE 2 


t(Const) D..1:2379 5.12379 5.12379 


Num obs 33.00000 33.00000 33.00000 
LogLike 75.10186 81./1155 81./1155 
AIC -4.49102 -4.83100 -4.83100 
Var res 0.00063700 0.00044051 0.00044051 


Cointegrating vector 


1 

LPRIMESEM 1.00000 
OBL -0.0036636 
LCAC 0.031730 
LSIN 0.0077736 
LDEP -0.93760 
LCP -0.026854 

-0.28088 
INF 0.0034336 


Summary of Engle-Granger (tau) cointegration tests 


TestStat P-value Num.lags 
1 -5.18638 à 1.00000 


La colonne 0 reprend les résultats du test DF, la colonne 1 ceux du test ADF(1). Le test DF 
est donc la valeur de TestStat de la colonne 0 : —3.21124, tandis que le test ADF(1) est 
la valeur de TestStat de la colonne 1 : —5.18638. Ces tests sont exactement égaux à ceux 
obtenus par la procédure manuelle décrite précédemment, dans les équations 2 et 3. 
Const et {(Const) correspondent respectivement à la constante estimée dans la relation de 
cointégration et à la f-stat de cette constante ; les valeurs de l’une comme de l’autre sont 
celles de l’équation 1 dans la procédure manuelle. Les valeurs de LogLike sont celles de Log 
of likelihood function dans les équations 2 et 3. Les valeurs de AIC sont celles du critère 
d’Akaiïke dans ces mêmes équations. Les probabilités critiques ne sont pas imprimées par 
TSP (il n'existe pas de table pour une relation à huit variables). Toutefois, en utilisant 
celle à six variables, on rejette l'hypothèse de racine unitaire pour le résidu de la relation 
estimée (cointégration entre les variables). 


ASSURANCE ET MODÈLE À CORRECTION D'ERREUR 


Énoncé 


Sur la base de l’estimation du vecteur cointégrant de l’exercice précédent, spécifiez et 
estimez un modèle à correction d’assurance pour le logarithme des primes. Utilisez les 
mêmes données que précédemment. Travaillez dans TSP. 


Pour estimer un modèle à correction d’erreur pour les primes totales en logarithmes, on 
envoie à TSP les instructions suivantes : 


freq à; 
smpl 1963 1999; 
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read(file=‘assur.x1s”): 

? 

? calcul des transformations logarithmiques 
? 
Isin=log(sini); 
Iprimesem=log(primesem) ; 
ldep=log(dep); 
lcp=log(cp); 
Icac=log(cac); 

? 
? calcul des différences 
7 
1964 1999; 
imes=lprimesem-1primesem(-1); 
ep=ldep-ldep(-1); 
=obl-obl(-1); 
ac=lcac-lcac(-1); 
in=isin-1sin(-) 

=lCp=TEp (=); 

f=inf-inf(-1) 

RECETTE 


5 


TD 


a 
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? estimation de la relation de cointégration 
? 
smpl 1965 1999; 
regopt(pvprint,lmlags=2,qlags=2) all; 
regopt(noprint) @vcov @vcor; 

noplots; 

olsq Iprimesem c obl Icac 1sin Idep Icp k inf; 
7 


? sauvegarde des résidus qui sont l’écart à l’équilibre 
2 


res=@res ; 
2 


? estimation du modèle à correction d’erreur 
2 


smpl 1966 1999; 

olsq diprimes c res(-1) 

diprimes(-1) dobl(-1) dlcac(-1) dlsin(-1) didep(-1) dlcp(-1) dk(-1) dinf(-1) 
dlprimes(-2) dobl(-2) dlcac(-2) dlsin(-2) dldep(-2) dlcp(-2) dk(-2) dinf(-2); 


Les commentaires insérés dans le programme facilitent la compréhension des opérations 
successives. Ici on a choisi arbitrairement deux retards pour toutes les variations des 
variables. Les résultats sont les suivants : 


Equation 2 


Method of estimation = Ordinary Least Squares 


Dependent variable: DLPRIMES 
Current sample: 1966 to 1999 
Number of observations: 34 


Mean of dependent variable = .089959 
Std. dev. of dependent var. .050749 
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Sum of squared residuals = .011828 
Variance of residuals = .739252E-03 
Std. error of regression = .02/7189 
R-squared = .860829 
Adjusted R-squared = .7/712959 
Durbin-Watson statistic = 2.03359 
Durbin’s h alternative = .118536 [.906] 
Breusch/Godfrey LM: AR/MAI = .014051 [.906] 
Breusch/Godfrey LM: AR/MA2 = 4.13464 [.127] 
Ljung-Box Q-statisticl = .118590 [.731] 
Ljung-Box Q-statistic2 = .305927 [.858] 


ARCH test = .047164 [.828] 
CuSum test = .532840 [.561] 
CuSumSq test = .155000 [.807] 


Jarque-Bera normality test = .043710 [.978] 
F-statistic (zero slopes) = 5.82154 [.000] 
Akaike Information Crit. = -4,06694 

Schwarz Bayes. Info. Crit. = -6.09675 

Log of likelihood function = 87.1380 


Estimated Standard 
Variable Coefficient Error t-statistic P-value 
C -.576536E-02 .017461 -.330193 [./46] 
RES(-1) -.471463 .250898 -1.87910 [.079] 
DLPRIMES(-1) .400682 .240846 1.66365 [.116] 
DOBL(-1) .421109E-02 .928274E-02 .453647 [.656] 
DLCAC(-1) -.548736E-02 .062097 -.088368 [.931] 
DLSIN(-1) .016499 .111949 .147383 [.885] 
DLDEP(-1) .086245 .329789 .261516 [./797] 
DLCP(-1) .015883 .097130 .163524 [.872] 
DK(-1) .162739 .148487 1.09599 [.289] 
DINF(-1) .583384E-02 .584087E-02 .998797 [3381 
DLPRIMES(-2) .420576 .236128 1./78113 [.094] 
DOBL(-2) .141081E-02 .010293 .137067 [.893] 
DLCAC(-2) .011/794 .049593 .237812 [.815] 
DLSIN(-2) .073032 .106076 .688490 [.501] 
DLDEP(-2) -.038658 .280898 -.137621 [.892] 
DÉCPES2) -.265483E-02 .102018 -.026023 [.980] 
DK(-2) -.020630 .200676 -.102803 [.919] 
DINF(-2) -.279242E-02 .573218E-02 -.487149 [.633] 


Le coefficient de res(-1) exprime le degré de variation du logarithme des primes, à la 
période courante, suite à une augmentation unitaire, à la période précédente, de l’écart 
entre le logarithme des primes et sa valeur d'équilibre. Une telle augmentation implique 
que les primes étaient à l’époque trop élevées par rapport à leur valeur d’équilibre. Pour 
corriger cet écart, il faut diminuer les primes. En toute logique, le coefficient estimé de 
res(-1) devrait être négatif. 


Puisque le nombre de variables explicatives est conséquent, la multicolinéarité est cer- 
tainement importante, ce qui explique que les coefficients ne peuvent pas être estimés 
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avec précision, que leurs écarts types sont par conséquent élevés, et par là même que leurs 
t-stats sont très faibles. Il faut simplifier ce modèle en supprimant les variables explicatives 
inutiles. On peut vraisemblablement supprimer toutes les variations retardées de deux 
périodes, sauf celle des primes, et presque toutes les variations retardées de une période. 
Pour estimer de nouveau le modèle avec ces restrictions, on envoie à TSP les instructions 
suivantes : 


freq à; 
smpl 1963 1999; 
read(file=‘assur.x1s’); 
? 
? calcul des transformations logarithmiques 
? 
Isin=log(sini); 
Iprimesem=log(primesem) ; 
ldep=log(dep); 
lcp=log(cp); 
Icac=log(cac);: 
? 
? calcul des différences 
? 
smpl 1964 1999; 
diprimes=lprimesem-lprimesem(-1); 
didep=ldep-ldep(-1); 
dobl=obl-obl(-1); 
dicac=lcac-lcac(-1): 
sin=lsin-lsin(-1): 
dicp=lcp-lcp(-1); 
nf=inf-inf(-1); 
dk=k-Kk(C-1); 


? estimation de la relation de cointégration 
? 
smpl 1965 1999; 
regopt(pvprint,lmlags=2,qlags=2) all; 
regopt(noprint) @vcov @vcor; 

noplots:; 

olsq Iprimesem c obl Icac Isin 1dep Icp k inf; 
? 


? sauvegarde des résidus qui sont l’écart à l’équilibre 
? 


res=@res ; 

? 

? estimation du modèle à correction d’erreur 
? 


smpl 1966 1999; 
olsq diprimes c res(-1) diprimes(-1) dinf(-1) diprimes(-2); 
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Les résultats sont les suivants : 
Equation 2 


Method of estimation = Ordinary Least Squares 
Dependent variable: DLPRIMES 
Current sample: 1966 to 1999 


Number of observations: 34 


Mean of dependent variable = .089959 


Std. dev. of dependent var. = .050749 

Sum of squared residuals = .014615 
Variance of residuals = .503952E-03 

Std. error of regression = .022449 


R-squared = .828041 
Adjusted R-squared = .804323 
Durbin-Watson statistic = 2.05801 


Durbin’s h alternative = -.277695 [.781] 
Breusch/Godfrey LM: AR/MAI = .077115 [.781] 
Breusch/Godfrey LM: AR/MA2 = 2.02168 [.364] 
Ljung-Box Q-statisticl = .437181 [.508] 
Ljung-Box Q-statistic2 = 1.05639 [.590] 
ARCH test = 1.40040 [.237] 
CuSum test = .511158 [.614] 
CuSumSq test = .201041 [.333] 
Chow test = 2.52281 [.057] 
LR het. test (w/ Chow) = 13.2146 [.000] 
White het. test = 18.4245 [.188] 
Jarque-Bera normality test = .423232 [.809] 
F-statistic (zero slopes) = 34.9112 [.000] 
Akaike Information Crit. = -4,.62010 
Schwarz Bayes. nfo. Crit. = -7.23351 
Log of likelihood function = 83.5417 
Estimated Standard 
Variable Coefficient Error t-statistic P-value 
C .333048E -02 .931957E-02 .357364 [./23] 
RES(-1) -.600287 .123689 -4,85320 [.000] 
DLPRIMES(-1) .465483 .128287 3.62846 [.001] 
DINF(-1) ./729985E-02 .241583E-02 3.02168 [.005] 
DLPRIMES(-2) .449595 .134504 3.34261 [.0021 


EXERCICE 3 ASSURANCE ET TESTS DE JOHANSEN 


Énoncé 


Spécifiez et estimez un modèle explicatif de l’évolution temporelle du total annuel des 
primes perçues par les sociétés françaises d’assurance en dommages. Plus précisément, 
expliquez l’évolution des primes réelles. Le logarithme de celles-ci est noté LPRIMESR, 
et est défini par LPRIMESR, = In(PRIMESEM, /PRIX,), où la variable PRIX, est l'indice 
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des prix à la consommation. Toutes les données nécessaires se trouvent dans le fichier 
ASSUR:xls. Les variables explicatives potentielles sont : 


— le logarithme du capital réel des sociétés d’assurance : LCPR; = In(CP,/PRIX;) ; 

— le logarithme des dépenses réelles : LDEPR; = In(DEP,/PRIX:) ; 

— le logarithme du PIB réel : LPIBR, = In(PIBLEVEL,) ; 

— le taux d'intérêt réel : OBLR, = OBL, — INF, ; 

— le taux de croissance de l’indice boursier réel : DLCACR,; = In(CAC,/PRIX;) — 
In(CAC;_:/PRIX;_:); 

— le logarithme des sinistres réels : LSINR, = In(SINI;/PRIX;). 

Il est facile de vérifier par des tests de racine unitaire que toutes ces variables sont intégrées 


d’ordre 1. Elles ne peuvent donc entretenir qu'une relation de cointégration. Testez cette 
éventuelle cointégration par la méthode de Johansen. Utilisez un VAR(2). 


Toutes les variables forment le processus stochastique multivarié {X,}, défini de la manière 
suivante : 


X1 lprimesr., 
X» Icpr., 
X3 Idepr, 
X; = | Xy | = Ipibr. 
X5t oblr: 
X6 Alcacr; 
X7 lsinr, 


Le processus {X;} est censé être déterminé par un système dynamique stochastique 
susceptible d’être représenté par un modèle VAR(2) : 


2 
X=u+ D XII + 
1 
c’est-à-dire que : 
PL)X; = up + uw 


où P(L) est un polynôme matriciel en l'opérateur de retard I, défini par : 


2 
®(L) — (e = D ou) 
1=1 


Chaque matrice D; est d'ordre 7 x 7. Le choix d’un VAR à deux retards est justifié par le 
fait qu'une dynamique à deux retards est bien adaptée à des séries annuelles : elle permet 
la présence de cycles dans les variables. L'existence de racines unitaires, établie par les tests 
précédents, implique que l’équation caractéristique (0 = |dD(L)]|) du système VAR admet 
des racines unitaires et donc que 0 — |[(1)|. Ainsi, la matrice D(1) = (G — se Di) 
est singulière. 


Par ailleurs, on montre aisément que D(L) se décompose de la manière suivante : 
DL) = P(1)L + (1 — L) (, — AL) 
où A; —= —®;,. 


Variables intégrées, modèles VAR et cointégration 


Par conséquent, le système VAR(2), dont la forme originale est D(L)X; = 1 + u;, peut 
encore s’écrire de la manière suivante : 


AX;= ph — B(1)X 1 + A AXS 5 + 


Les variables de X sont cointégrées, avec r vecteurs de cointégration linéairement indé- 
pendants si le rang de (1) est égal à r (< n) et s’il existe des matrices « et B, de type 
7 x ret de rang r, où 0 < r < n, telles que D(1) — —af’. On peut alors représenter 
le système VAR(2) sous la forme d’un mécanisme à correction d’erreur, de la manière 
suivante : 

AX;= Rp + af'X;-1 + A1 AX; 1 + us 


La matrice de cointégration $ est de type 7 x r et telle que chaque colonne est un vecteur 
de cointégration distinct des autres. Le vecteur B'X,_1, qui a r éléments, est le vecteur des 
r expressions cointégrées qui mesurent chacune un écart par rapport à l’une des relations 
d'équilibre (à une expression correspond une relation, et inversement), à la période { — 1. 
Si l’on explicite les matrices, la forme à correction d’erreur est : 


Aprimesr, Li Mir. Mg 22 Je 
Acpr: M2 O1 O2 *** Or 
. —:\|1 2 LE 
ASsinirs 7 be An **” al 
Buprimesr;_1 + Baicpri_1 + ++: + Brsinirs 1 
Biaprimesr;_1 + Baxcprs_1 + ++: + Brsinirs 1 
x . 
Birprimesrs_1 + Barcpri1 +: + Brrsinire 
Gi11 4121 ‘' 417, Aprimesr;_1 Us 
G211 4221 ‘'' 427, Acprs-1 Us | 
Ÿ + 
4711 4721 ‘‘: 477, Asinirs_1 Us 


En cas de cointégration, le système VAR(2) cointégré à correction d’erreur est donc le 
système d’équations suivantes pour les sept variables : 


Alprimesr: = li + oi (Brilprimesr:_ + Bailcpri-1 ++: + Brisinr,_:) 

+ ou2 (Bialprimesr:_1 + Baalcpre-1 + ++: + Balsinri1) ++. 

+ or (Bi-lprimesr:_1 + B2,lcpre_1 + +: + Brilsinr:_1) 

+ an Alprimesr:_1 + a Alcpri-1 +: + a171 Alsinr:_1 + ur: 


Apr: = la + O1 (Buiprimesrs_1 + Baicpre-1 + ++ + Brsinirs_1) 

+ 022 (Biaprimesri_1 + Baacpri_1 + ++ + Brsiniri_1) ++. 

+ ou, (Bisprimesrs_1 + Ba,cpri-1 + + + Brsinirs_1) 

X 4n1 Aprimesrs_1 + 4221 Ars + * +: + G271 ASinir;_1 + Ur 
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ASinire = 7 + O7 (Buprimesr:_ bte Bsinirs-1) 

+ 02 (Biaprimesr:_1 + Baacpri1 + ++: + Basinir,_1) ++. 

+ or (Bisprimesre_1 + Bascpri-1 + + + Brrsinir_1) 

X 471 Aprimesrs_1 + 4721 Acprs_1 + * +: + G771 ASinir;_1 + Ur 


Chaque coefficient ;; de la matrice à représente le taux de réaction de la 5° variable à 
l'écart précédent par rapport à la j° relation d’équilibre. Il s’agit donc du taux de correction 
de la variable j, suite à l'observation de l’écart (ou déséquilibre) précédent, par rapport 
à la j° relation d’équilibre. Chaque coefficient à, de la matrice A; représente le taux de 
réaction de la 5 variable à la variation passée, à la période précédente, de la [° variable. 


Il faut vérifier la cointégration, c’est-à-dire que r est supérieur à 0, et identifier quelle est 
la valeur précise de r. 


Réalisation avec les logiciels 


Pour tester (1) La cointégration entre LPRIMESR, LCPR, LDEPR, LPIBR, OBLR, DLCACR 
et LSINR par la méthode de Johansen, avec un VAR(2) sans tendance déterministe ajoutée 
et sans restriction sur 1, on utilise les instructions TSP suivantes : 

PL 1963 1999: 

RE 
EAD(FILE="C :\ASSUR.XLS"):; 
PRIMESR=LOG(PRIMESEM/PRIX) ; 
D 

I 

I 


[æ 


R=LOGCCP/PRIX) ; 

PR=LOG(DEP/PRIX); 

R=LOGCSINI/PRIX):; 

=LOG(PIBLEVEL); 

LR=OBL-INF; 

PL 1964 1999; 

CACR=LOG(CAC/PRIX)-LOG(CAC(-1)/PRIX(-1)); 

INTCNOUNIT,JOH,NoeG, MINLAG=I, MAXLAG=1, CONST, NOTREND) LPRIMESR LCPR LDEPR LPIBR 
LR DLCACR LSINR; 


D 
S 
D 
B 
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L'option MAXLAG=1 commande Putilisation d’un VAR(2), puisque MAX LAG est le nombre 
de retards des différences des variables dans le VAR à correction d’erreur. Les résultats 
sont les suivants : 


Johansen (trace) cointegration tests 


Variables: LPRIMESR LCPR LDEPR LPIBR OBLR DLCACR LSINR 


Num lags 1 
Eigvall 0.86788 
Eigval2 0.72159 
Eigval3 0.674277 


1. Le rang de cointégration est déterminé par un test sur la nullité des (7 — r) plus petites valeurs propres, ce 
qui correspond à un test de rapport de vraisemblance. 


Variables intégrées, modèles VAR et cointégration 


Eigval4 0.41006 
Eigvals 0.35690 
Eigvalé6 0.20504 
Eigval7 0.021400 
HO : r=0 112.89414 
P-valAsy 0.20319 
HO :r<=1 72.41334 
P-valAsy 0.62619 
HO : r<=2 46.83983 
P-valAsy 0.77153 
HO: r<=3 24.40583 
P-valAsy 0.89665 
HO : r<=4 13.85115 
P-valAsy 0.83/798 
HO:r<=5 5.02197 
P-valAsy 0.82994 
HO: r<=6 0.43265 
P-valAsy 0./76107 
um obs 34.00000 
LogLike 414.54897 
AIC -309.54897 


Cointegrating vectors for lag 1 


1 2 3 4 
LPRIMESR 1.00000 1.00000 1.00000 1.00000 
LCPR 0.22032 -0.015788 -0.11433 -0.000081383 
LDEPR -0.54291 -3.14043 -0.78067 0.39600 
LPIBR 0.45399 2.92425 0.47101 -2.07179 
OBLR -0.020367 0.024538 -0.00022052 0.0091099 
DLCACR -0.081621 -0.35504 -0.75793 0.096830 
LSINR -0.83078 -0.30152 0.011665 0.13164 
5 6 7 
LPRIMESR .00000 1.00000 .00000 
LCPR -0.55720 -0.48067 -0.087056 
LDEPR . 25083 -6.44803 -4.46339 
LPIBR .69603 6.43380 3.95079 
OBLR 0.055339 -0.061996 0.0039189 
DLCACR 0.16266 0.30600 0.018163 
LSINR -1.88432 1.22627 0.52168 


Les valeurs du test de la trace sont inférieures à celles données par les formules originales 
de Johansen, en raison de la correction pour de petits échantillons, utilisée par TSP. Le 
test de la plus grande valeur propre n’est pas disponible dans la procédure automatique 
de TSP, mais peut être programmé aisément. 


Les Eigval sont les valeurs propres classées par ordre décroissant. Viennent ensuite les 
valeurs du test de Johansen pour les hypothèses successives sur la valeur de r, avec leurs 
probabilités critiques. Celles-ci sont interpolées à partir des valeurs critiques des tables 
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Tableau 6.1 


Test fondé sur la 
valeur propre 
maximale 


Tableau 6.2 


Test fondé 
sur la trace 


d’Osterwald-Lenum [OST 1992]. Les valeurs du test sont très élevées pour les petits r; à 
partir de l'hypothèse r < 3, elles deviennent suffisamment petites. Si l’on décide de ne 
pas rejeter l'hypothèse que r = 3, les vecteurs cointégrants correspondants sont les trois 
premières colonnes du tableau des « cointegrating vectors ». 


Avec d’autres logiciels, on obtient les résultats suivants pour les tests originaux de Johansen, 
sur les mêmes données, en utilisant de nouveau un VAR(2), sans tendance déterministe 
ajoutée et sans restriction sur la constante. 


HO H1 Test Valeur Critique à 95 % | Valeur Critique à 90% 
r = 0 = | 68./7972 45.6300 42.7000 
r<= ! = 2 43.5940 39.8300 36.8400 
r<= 2 =;.3 38.1290 33.6400 31.0200 
P<=:S = À 17.8790 27.4200 24.9900 
r<= 4 = 5 15.0292 21.1200 19.0200 
PK=S = 6 7.7850 14.8800 12.9800 
r<= 6 7. 0./7393 8.0700 6.5000 
HO H1 Test Valeur Critique à 95 % | Valeur Critique à 90 % 
Fr0 >=] 191:9527 124.6200 119.6800 
r<= ? >= 2 123.1555 95.8700 91.4000 
PK=: 2 >= 3 79.5615 70.4900 66.2300 
r<= 3 >= 4 41.4325 48.8800 45.7000 
r<= 4 >= 5 235535 31.5400 28.7800 
Ê<=.5 >= 6 8.5243 17.8600 15.7500 
P<="6 eu 0./7393 8.0700 6.5000 


On utilise ici les valeurs critiques définies par la méthode de Pesaran, Shin et Smith 
[PES 1996] plutôt que celles définies par Johansen ou par Osterwald-Lenum. À partir de 
l'hypothèse r < 3, les valeurs du test sont inférieures aux valeurs critiques. Ces résultats 
suggèrent l’existence de trois relations de cointégration entre les variables étudiées. Sous 
cette restriction (r = 3), les vecteurs de cointégration estimés sont les suivants : 


Les valeurs entre parenthèses sont les vecteurs estimés normalisés lorsqu'on impose la 
valeur —1 au premier coefficient. Mais il ne s’agit que d’une normalisation provisoire 
pour faciliter une première lecture des résultats. On voit que ces vecteurs normalisés sont 
quasiment identiques aux trois premiers vecteurs trouvés par TSP, aux colonnes 1 à 3. 

La méthode de Johansen permet donc d’obtenir trois vecteurs de cointégration estimés. 
Toutefois, ils ne sont pas identifiés puisque toute combinaison linéaire de ces vecteurs 
estimés peut aussi être considérée comme un vecteur de cointégration. Pour les identifier, 
il faut imposer des restrictions d’identification dans le but de choisir des vecteurs B,, B;, 
B; particuliers (qui sont les colonnes d’une matrice B) parmi l’infinité de vecteurs qui 
sont des combinaisons linéaires des vecteurs estimés B:, B, B3 (ceux-ci étant les colonnes 
de la matrice B). 


Les restrictions de normalisation choisies sont : 


B;=—1 Vi=1,...,3 
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Tableau 6.3 


Vecteurs de 
cointégration 
estimés sous 
l'hypothèse r = 3 


chapitre 


Vecteur 1 


Vecteur 2 


Vecteur 3 


primesr+ 


cprt 


depr+ 


pibrt 


PF 


ACacrt+ 


sinire 


( 


( 


( 


( 


( 


( 


-3.1902 
-1.0000) 
-./0301 
-.22037) 
1./356 
.54404) 
-1.4528 
-.45540) 
.065018 
.020381) 
.26140 
.-081938) 
2.6504 


( 


( 


( 


( 


2.9196 
-1.0000) 
-.047764 
.016360) 
-9.1149 
( 3.1220) 
8.4761 
-2.9032) 
.0/0862 
-.024271) 
-1.0366 
( .35504) 
-.87012 


-2.1187 
( -1.0000) 
.24429 
(_.11530) 
1.6146 
( .7/6207) 
-.95198 
( -.44932) 
.8165E-3 
( .3854E-3) 
1.6153 
( .7/6241) 
-.034227 


( .83081) (_.29803) ( -.016154) 


Ces normalisations suggèrent implicitement que l’on souhaite interpréter le premier 
vecteur de coïintégration comme une relation portant sur la détermination des primes, le 
deuxième vecteur de cointégration comme une relation portant sur la détermination du 
capital, et le troisième comme une relation portant sur la détermination des dépenses. 


Des restrictions supplémentaires d'identification doivent également être imposées. Pour 
que les coefficients cointégrants soient tous exactement identifiés, il faut imposer deux 
restrictions sur les coefficients de chaque vecteur normalisé. 


Ici, il semble raisonnable d'imposer que le PIB n’a pas d’influence directe sur les primes à 
long terme (il a un impact indirect en raison de son influence éventuelle sur les sinistres, 
qui affectent de manière essentielle l’évolution tendancielle des primes en question). 
Par ailleurs, à long terme, l’élasticité des primes réelles aux sinistres réels ne peut être 
qu'unitaire, pour respecter la cohérence théorique macroéconomique et financière. 


On peut aussi raisonnablement supposer que l’évolution du capital des assureurs n’est 
pas liée directement au PIB réel, ni au taux d’intérêt réel à long terme. 


Quant aux dépenses réelles des assureurs, elles n’ont pas de raison d’entretenir une 
relation d’équilibre spécifique avec le taux d’intérêt réel et le taux de rendement réel des 
actions. 


On choisit donc des vecteurs B,, B,, B; qui sont des combinaisons linéaires des vecteurs 


originaux 1, 2, B : 


Bi =BiWi, Bo=BoW, B3 = B5W3 


où les poids W1 = | b; des combinaisons linéaires 
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doivent être sélectionnés sous les contraintes suivantes : 


Bai B12 B13 
Bai Ba2 Bas 
B71 B72 B73 


Ces poids sont : 


ai Bu 
W= {bi |=|Pp«u 
Ci Br 


Bi B22 B23 


ai —] d _ 
b1 | = 0, Bar Paz Pas b | — 0 |; 
G 1 Bs1 Bs2 B53 © 0 
B31 32 P33 43 —1 
Bs1 PBs2 B53 b; | = 0 
Bei Be2 Be C3 0 
à RAR. = A A SNA 
Bio Bi —1 a2 Bai Ba Ba —1 
Bar Bas 0, W=!{b Bar Bar Bas 0 |, 
Br BP 1 C2 Bs1 B52 Bs3 0 
A : NE 
a3 Bs1 B32 B33 1 
W3 = | b3 | =! Bs Ps Ps 0 
C3 Bai Be Bo 0 


On obtient une matrice de coefficients cointégrants exactement identifiés de la forme : 


ps 
bn —1 
bu 0 
B = 0 En 
ba 0 
bi be 
1 Ên 


B73 


Les contraintes appliquées précédemment n’imposent aucune restriction sur l'estimation 
du système dynamique cointégré par maximum de vraisemblance. Il s’agit uniquement de 
restrictions d'identification exacte. Comme toute restriction d’identification exacte dans 
un modèle économique, elles ne font que révéler la manière arbitraire dont on choisit 
d'interpréter le modèle. On ne peut donc pas les tester statistiquement, mais on peut 
tester leur pertinence d’un point de vue économique, en s’assurant qu’elles donnent lieu 
à des relations dont les coefficients estimés sont plausibles économiquement. Or, cette 
plausibilité est globalement atteinte ici puisque les résultats précédents impliquent les 


trois relations 


’équilibre suivantes : 


primesr, = —0,29 cpr, + 0,05 depr, + 0,03 r; — 0,03 Acacr, + 1 sinir, 
cpr: = 4,64 primesr, — 1,78 depr, — 4,66 Acacr; + 1,30 sinir; 
depr; = 0,48 primesr, + 0,96 pibr, + 0,10 cpr; — 0,39 sinir, 
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Tableau 6.4 


Vecteurs de 
cointégration 
estimés 
normalisés et 
exactement 
identifiés 


chestte 


primesr+ 


cprt 


depr+ 


pibr+ 


rt 


AcCacrt+ 


sinire 


Vecteur 1 
-1.0000 
Ere) 
-.29218 
( .052699) 
.045879 
( .19062) 


.030349 
( .010152) 
-.025130 
( .17613) 
1.0000 


4.6432 
( 10.4752) 
-1.0000 
(us) 
-1.7860 
( 5.0761) 
0.00 


-4.6572 
( 5.8787) 
1.3021 


Vecteur 3 


Vecteur 2 


.48373 
( .18715) 
.095449 
(_.051613) 
-1.0000 
(+2) 
.95807 
(15362) 


-.39318 


(4) 


Ces relations peuvent encore s’exprimer de la manière suivante : 


(re) - ( CP, ). ( DEP, 1 DOBr-003Acuer ( SINI, ) 
PRIX, = PRIX, PRIX, PRIX, 
( CP; ) _ ES (Ge 7 has És 1 
PRIX, PRIX, PRIX, PRIX, 
DEP, PRIMES NE. EGP. NET: SINTE NT PIB NP 
(ms) _ ( PRIX, ) (mr) (ns) (ee) 

La première relation d'équilibre indique qu’à long terme, les primes réelles sont propor- 
tionnelles aux sinistres réels. Le coefficient de proportionnalité est d’autant plus faible que 
le capital réel est élevé, et d'autant plus élevé que les dépenses réelles et le taux d’intérêt 
réel sont élevés ; il diminue si le rendement réel boursier augmente. L'élasticité unitaire des 
primes réelles aux sinistres réels s'explique par le fait que les primes réelles sont constituées 
pour l’indemnisation des sinistres, et sont donc fondamentalement déterminées par les 
anticipations rationnelles de ceux-ci. La relation négative des primes réelles au niveau 
du capital réel des assureurs semble confirmer la validité de la théorie des contraintes 
de capacité. La relation positive des primes réelles aux dépenses réelles s'explique par 
la nécessité, pour les assureurs, de percevoir les recettes nécessaires au paiement de ces 
charges. La relation négative des primes réelles au rendement boursier réel s’explique par 
le fait que l’augmentation du rendement financier des placements permet d’accepter un 
taux de profit technique plus faible, et donc des primes réelles plus faibles. C’est une 
implication du MEDAF (Modèle d’Équilibre des Actifs Financiers) de l'assurance. On 
devrait donc aussi observer une relation négative entre primes réelles et taux d’intérêt 
réel, mais la relation positive obtenue ici s'explique par la corrélation forte entre le taux 
d'intérêt réel et le taux de croissance réel de l’activité économique (conformément à 
la théorie de l’équilibre général) : une augmentation du taux d’intérêt réel reflète une 


augmentation de la croissance globale, qui dope la demande de produits d’assurance et 
pousse les primes à la hausse. 
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Tableau 6.5 


Vecteurs de 
cointégration 
estimés 
normalisés avec 
restrictions de 


suridentification 
(B73 = —B13 et 
Bas = 1) 


La deuxième relation d’équilibre signifie qu’à long terme, le capital réel des assureurs croît 
si les sinistres réels augmentent, car cela les incite à lever de nouveaux capitaux. Le capital 
réel est également, et très logiquement, affecté à la hausse par le niveau des primes réelles 
émises et affecté à la baisse par le niveau des dépenses réelles. Une augmentation du taux 
de rendement boursier réel permet de détenir moins de capitaux réels car le rendement 
financier de ceux-ci est plus élevé. 


La troisième relation d’équilibre suggère que les dépenses réelles liées à la vente des 
produits d’assurance et à la gestion des sinistres augmentent logiquement avec le 
niveau des primes émises et le capital réel des assureurs, qui mesure la capacité de 
production du secteur. Toutefois, les dépenses totales réelles diminuent si le rapport 
des sinistres aux primes augmente, ce qui semble suggérer qu'une augmentation des 
sinistres incite les assureurs à diminuer leurs frais de gestion pour maintenir la rentabilité, 
et qu'une croissance des sinistres induit une croissance des dépenses de gestion infé- 
rieure à la croissance des dépenses de distribution induite par une croissance des primes 
émises. 

Sur la base des résultats précédents, il semble raisonnable de tester des restrictions de 
suridentification, en plus des restrictions d’identification exacte. On vérifie B73 — —613 
et B43 = 1, avec toutes les restrictions précédentes. On obtient les résultats suivants : 


Vecteur 1 Vecteur 2 Vecteur 3 
primesrt -1.0000 3.0642 .51845 
(se) ( 5.6436) ( .20835) 
Cpr+ -.28728 -1.0000 .13054 
( .047368) (re) ( _.032923) 
deprt .038765 -1.6938 -1.0000 
( .16441) ( 2.5250) 6.5) 
pibrt+ -.0000 .0000 1.0000 
(= ) 6 HU) (5. 
rt .029035 .0000 -.0000 
( _.010034) (ets) Cu) 
Acacrt .0085136 -3.1791 .0000 
( .13634) ( 2.5978) Guen) 
sinirt 1.0000 1.9917 -.51845 
(Gi #1) ( 2.1812) ( .20835) 


Ces restrictions de suridentification ne sont pas rejetées puisque le test Chi-2 (2) du rapport 
de vraisemblance donne une valeur de 0.44216, à laquelle est associée une probabilité 
critique de 80,2 %. Le logarithme de la fonction de vraisemblance avec seulement des 
restrictions d'identification exacte vaut 393.7614 alors qu’il vaut, avec les restrictions de 
suridentification, 393.5404. 


2 


Les nouvelles relations d’équilibre peuvent s’écrire : 
primesr, = —0,29 cpr, + 0,04 depr, + 0,03 r; + 0,01 Acacr, + 1 sinir, 


cprr = 3,06 primesr, — 1,69 depr, — 3,18 Acacr, + 1,99 sinir, 
depr, = 1 pibr, + 0,13 cpr, — 0,51 (sinir, — primesr;) 
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Tableau 6.6 


Vecteurs de 
cointégration 
estimés 
normalisés avec 
restrictions de 


suridentification 
(B73 = —B13, 
Bas = let 

B23 = 0) 


cheptire 


Comme précédemment, on peut représenter ces relations d’équilibre de la manière a 
suivante : 
PRIMES,\ _ {f{ CP, \ °” [ DEP, \°* om +001acuer | ( SENI: 
PRIX, }  \\PRIx, PRIX, PRIX, 
CP, PRIMES NS DÉPENS nee PSINLE Ne 
= e 
PRIX, PRIX, PRIX, PRIX; 
DEP,\ _{f{ CP, \**{ SINI, \\/ PIB, 
PRIX, )  \\PRIX, PRIMES, PRIX, 
Ces nouvelles relations d’équilibre apportent peu de changements en termes de signes des 
coefficients. Seul le signe du coefficient du taux de rendement réel des actions change : il 
est désormais le même que celui du coefficient du taux d’intérêt réel, et s'oppose à ce que 
suggère le MEDAF de l'assurance. 
Sur la base des résultats précédents, on ajoute à ces restrictions l'hypothèse que B3 = 0. 
On obtient alors les résultats suivants : 
Vecteur 1 Vecteur 2 Vecteur 3 
primesr+t -1.0000 9.1297 .60767 
6,51) ( 7.7425) ( .34110) 
CPr+ “1; 17%2 -1.0000 .0000 
( 1.8462) CH) (us) 
depr+ 4.8323 -1.6442 -1.0000 
( 7.3529) ( 4.4203) CR) 
pibr+ -.0000 -.0000 1.0000 
Co) te 2 (en 
rt -.031781 .0000 -.0000 
( .20409) (=) (2 
AcCacrt+ .4994T .36283 .0000 
( .64560) Gas 1) (x) 
sinir…t 1.0000 -9.1574 -.60767 
(ht) CEA AIT) ( .34110) 
Les relations cointégrées sont donc : 
lprimesr; = —1,18 lcpr, + 4,83 ldepr; — 0,03 oblr, + 0,50 Alcacr; + 1 lsinr; 
lcpr,; = 9,12 lprimesr, — 1,64 Idepr, + 0,36 Alcacr, — 9,15 lsinr, 
Idepr, = 1 lpibr, — 0,60 (lsinr; — Iprimesr;) 
On peut les représenter ainsi : 
PRIMES,\ ff CP: \ ”"* [ DEP, \*® Q-003m+050aauen Ÿ f/ SINT: 
PRIX, ]  \\PRIX, PRIX, PRIX, 
CP; PRIMES, \*"® { DEP, \ ® psçacam ( SINE \ 
= ——— e ? 
PRIX, PRIX, PRIX, PRIX, 
DEP,\ _{ SINI \ */f PIB, 
PRIX, )  \'PRIMES, PRIX, 
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Tableau 6.7 


Équation de 
Aprimesr; 


Du point de vue de leur plausibilité économique, ces résultats sont particulièrement 
intéressants. Cette fois, dans la relation d’équilibre des primes, le taux d’intérêt a le 
coefficient négatif suggéré par le MEDAF de l’assurance. En revanche, le rendement 
boursier réel a un coefficient positif : il joue vraisemblablement ici le rôle de « proxy » 
(c’est-à-dire d’une variable de remplacement) pour le taux de croissance réel de l’activité 
avec lequel il est très corrélé. Lorsque la croissance réelle est forte, la demande de produits 
d'assurance est élevée et pousse les primes réelles à la hausse, conformément à la théorie 
de la capacité contrainte. Avec cette nouvelle restriction, la relation d'équilibre du capital 
des assureurs devient alors plus aisée à interpréter : les primes émises font augmenter le 
capital, tandis que les sinistres et les dépenses le réduisent. Les gains boursiers provoquent 
également une augmentation du capital. Toutefois, les restrictions imposées ne sont pas 
acceptées puisqu'un test Chi-2 (3) du rapport de vraisemblance donne une valeur de 
85,5719, à laquelle est associée une probabilité critique de 0,000 %. 


On s'intéresse maintenant au modèle VAR complet, qui est à court terme, dont la solution 
d'équilibre (ou à long terme) est donnée par les trois vecteurs de cointégration définis 
précédemment. 


Puisque la dernière restriction n’est pas acceptée, on conserve seulement les vecteurs de 
cointégration avec les hypothèses de suridentification B73 = —B13 et Bas = 1. 


On définit de nouvelles variables ecml, ecm2 et ecm3, qui sont les écarts par rapport aux 


2 


trois relations d’équilibre : 


ecml; = —0,29 cpr, + 0,04 depr, + 0,03 r, + 0,01 Acacr, + 1 sinir, — primesr, 
ecm2; = 3,06 primesr, — 1,69 depr, — 3,18 Acacr; + 1,99 sinir, — cpr; 
ecm3; = 1 pibr, + 0,13 cpr, — 0,51 (sinir, — primesr,) — depr, 


Le modèle VAR(2) cointégré à correction d’erreur fournit des résultats d’estimation sur 
la période 1966-1999, pour les sept équations simultanées du système. On obtient les 


2 


résultats suivants pour l’équation relative aux primes : 


Coefficient estimé Écart-type Statistique t [Probabilité 

critique] 
(es 0.98187 .28464 3.4495 [.002] 
Aprimesrt#-] -0.03514 22114 -0.1589 [.8/75] 
ACPpr+. -0.09543 .08160 -1.1694 [.254] 
Adeprt-1 0.1/7098 .28779 0.5941 [.558] 
Apibrt-1 #0:12923 .43508 -0.2970 [./69] 
Ari -0.01011 .00551 -1.8341 [.080] 
A(Acacr):. -0.02089 .03225 -0.6476 [.524] 
ASsinire -0.00835 .07673 -0.1089 [.914] 
ecml:-1 0.30047 .08171 3.6771 [.001] 
ecmz+.] -0.00399 01496 -0.2666 [./92] 
ecm3:. 0.33231 .20087 1.6544 [.112] 
R? .69601 


Variables intégrées, modèles VAR et cointégration 


Tableau 6.8 


Équation de 
Aprimesr; 


cheste 


Dans l’équation des variations des primes réelles, les variables différenciées prennent 
en compte les effets à court terme des variables passées, tandis que les variables ecm 
représentent les différences par rapport aux relations à long terme. Le seul coefficient 
significatif (même si le caractère « significatif » n’a pas une grande importance ici, puisque 
le terme d’erreur n’est pas un bruit blanc) concerne les taux d’intérêt réels à long terme, 
dont le coefficient négatif confirme les conclusions des modèles financiers de l'assurance 
(comme le MEDAEF) : quand les taux d’intérêt diminuent, les primes augmentent, afin 
de compenser la baisse des résultats financiers. Il en est de même quand l’indice boursier 
diminue. Cet effet est donc valable à long terme (comme montré précédemment) et 
à court terme, même s’il ne s’agit, pour l’instant encore, que des effets des variables 
retardées. 


La variable ecml;_1, par exemple, est la différence entre la valeur d’équilibre des primes au 
temps f et la valeur observée des primes au temps f — 1. Quand les primes sont trop faibles 
par rapport à la relation d'équilibre, elles doivent augmenter pour retrouver l'équilibre : 
il est donc normal que le coefficient de ecml,;_ soit positif. 


Puisque les coefficients ecm2;_ etecm3;_; nesont pas significatifs, les primes ne répondent 
pas au déséquilibre concernant le niveau des fonds propres et les dépenses. 


Après l'étude du VAR(2) cointégré ne contenant que les restrictions de suridentification 
acceptées, on examine un VAR(2) avec la restriction de suridentification supplémentaire 
donnant des vecteurs de cointégration plus plausibles économiquement. En effet, Pesaran 
[PES 1997] montre que le test du ratio de vraisemblance des restrictions sur les coefficients 
des vecteurs de cointégration a tendance à rejeter abusivement des restrictions vraies. Dès 
lors, il est sage d'utiliser des vecteurs de cointégration qui ont une bonne plausibilité éco- 
nomique, même s'ils sont le résultat de restrictions de suridentification rejetées (comme 
c’est le cas dans le modèle VAR cointégré à correction d’erreur, qui utilise les vecteurs de 
cointégration avec l'hypothèse supplémentaire que B23 = 0). 


C’est la raison pour laquelle il est intéressant d’observer le VAR obtenu lorsqu'on impose 
les restrictions sur les vecteurs qui donnent des résultats économiquement vraisemblables 
(à B73 — —B13 et Bas — 1, on ajoute B}3 — 0). 


Coefficient estimé Écart-type Statistique t [Probabilité 

critique] 
C ./56700 .30634 2.47020 [.021] 
Aprimesr+.i 159840 .22679 ./0481 [.488] 
ACpr+-1 .004936 .07107 .06946 [.945] 
Adepr+.] -.083749 .32407 -.25843 [./98] 
Apibr+ .001925 .50952 .00378 [.997] 
Art .002905 .00500 .58084 [.567] 
A(Acacr}: -.016564 .02507 -.66083 [.515] 
Asinirs. .004676 .08970 .05214 [.959] 
ecmlt+-1 -.031495 .01853 -1.69940 [.103] 
ecm2t+-] -.011736 .01777 -.66052 [.515] 
ecm3t-1 .099328 .35493 .27985 [./82] 
R? .59960 
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EXERCICE À 


On définit alors de nouvelles variables ecml, ecm2, ecm3, qui sont les écarts par rapport 
aux trois relations d’équilibre : 
ecml; = —1,18 cpr, + 4,83 depr,; — 0,03 r, + 0,50 Acacr, + 1 sinir, — primesr, 
ecm2; = 9,12 primesr; — 1,64 depr, + 0,36 Acacr, — 9,15 sinir, — cr; 
ecm3; = pibr; — 0,60 (sinir, — primesr,) — depr, 
Puisque le terme d’erreur n’est pas un bruit blanc, les écarts types publiés sont erroné, et 
l’on ne peut attacher d'importance au caractère significatif ou non des coefficients. Seul Le 
signe du coefficient des variations du rendement boursier de l’année antérieure ne change 


pas par rapport à l’estimation précédente. Le signe des sinistres correspond mieux à la 
réalité : en cas de hausse des sinistres l’année précédente, les primes augmentent. 


ASSURANCE ET MODÈLE VAR CONDITIONNEL 
À CORRECTION D'ERREUR 


Énoncé 


Le modèle VAR cointégré représente la relation des sept variables avec leur passé, sous 
forme de correction d’erreur autour d’une relation d'équilibre. Cette modélisation permet 
d'identifier des relations à long terme entre les variables, et les effets à court terme des 
variables passées sur les variables contemporaines. Dans ce modèle ne sont pas représentées 
les relations contemporaines, c’est-à-dire les relations entre les différentes variables à la 
même date. On souhaite à présent s’y intéresser. Pour améliorer la modélisation, il est 
également naturel d'envisager la formation des principales variables d'intérêt (primesr, 
cpr, depr) conditionnellement aux autres variables. L'objet de cet exercice est donc de 
spécifier un modèle à correction d’erreur pour primesr, cpr, et depr, conditionnel aux 
variables pibr, r, Acacr et sinir, qui permette d'introduire les incidences contemporaines 
(ou instantanées) de ces quatre variables sur primesr, cpr et depr. 


Le vecteur u, des termes d’erreur du système dynamique cointégré est supposé non 
autocorrélé et distribué d’après une normale de matrice de variance et de covariance Z 
c’est-à-dire : u, + N (0, >). Il en résulte la distribution conditionnelle suivante de AX, 
par rapport à son passé : 


AXs XX, N(u + aB'Xi 1 + A1AX5 1, E) 


56 y ; 
On partitionne le vecteur X, en X, — ë } où Y, est un vecteur 3 X 1, 
t 


et Z; un vecteur 4 x 1: 


X ibr 
Xi; primesr, . UE 
X5+ T+ 
Y= | Xx | = cpre » Z1= = 
X6 Acacr; 
X3 depr: Je 
X7 sinir; 


On partitionne également le vecteur [1 et la matrice X : 


L Ha 
1 
1 2 F5 Zn Zn 
M = | M » M — » 2= 
H6 Zn X 
34 
M7 
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O11 O12 013 O14 015 O16 017 
Zu = | O2 62 O2 |; Zi = | O2 O2 626 027 |, 

O31 032 033 O34 035 036 037 

O41 O42 043 O44 O45 O46  O47 

O51 O52 O53 O54 O55 O56 057 
DEN —= > DS — 

O61 O62 O63 O64 065 O66 067 

O71 072 073 O74 075 076 077 


On partitionne les matrices à et A, de manière adéquate : 


1 
A = 
2 


où o, est une matrice 3 x 3 contenant les trois premières lignes de @, et 4; une matrice 
4 x 3 contenant les quatre dernières lignes de @. 


An 


A; —= 
A2 


où A1, est une matrice 3 x 7 avec les trois premières lignes de À, et A; une matrice 4 x 7 
avec les quatre dernières lignes de A. 


L'hypothèse de normalité précédemment évoquée permet de déduire la distribution condi- 
tionnelle de AY; conditionnellement à Z; et au passé de X, et la distribution marginale 
de AZ, : 


AY: 12 Xi Xo-2 


dd) 
Zu — 202» 2 


AZ Zi, Zr2... ON (lu + o2B"X;-1 + An AX5 1, 22) 
On peut encore écrire : 


AY, = (li — E23 2) + (En2») AZ + (oi — X12 233 2) B'X;-1 
+ (An : 12» An) AX3_1 + Us 
AZ}? = lo + oB"X;-1 + An AX$ 1 + Us 


où Ua = ul — Zi 23 ue. 

La première équation matricielle est un modèle à correction d’erreur conditionnel en 
forme réduite, tandis que la deuxième est un modèle à correction d’erreur marginal 
[BOS 1992]. Ces deux équations sont un simple reparamétrage du système VAR cointégré 
original. Elles contiennent donc la même information, mais présentée différemment. 

Ici, (ba = 2122» Lu) et #1, sont des vecteurs 3 x 1, 21222, est une matrice 3 x 4, 
(oi — 212 232 2) une matrice 3 x 3, B'X;_1 un vecteur 3 x 1, (o1 — 2122» tu) B' une 
matrice 3 x 7,et (Au — 2122» Ai) une matrice 3 X 7. 
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Tableau 6.9 


Équation de 
Aprimesr; 


Le modèle conditionnel peut être estimé isolément si Z, est faiblement exogène pour 
les paramètres de l'équation (1), Si c’est le cas, on peut ignorer le modèle marginal pour 
réaliser de l’inférence sur les paramètres du modèle à correction d’erreur conditionnel, y 
compris sur les paramètres des vecteurs de cointégration. Une exogénéité faible apparaît 
effectivement si &> — 0, comme l’a prouvé Johansen. Cette condition a pour but de 
rendre indépendants les deux systèmes. Elle a pour conséquence d’éliminer la présence 
du terme correcteur d’erreur dans le modèle marginal (qui est toutefois dans le modèle 
conditionnel). 


La manière correcte de réaliser de l’inférence statistique sur ce modèle conditionnel dépend 
donc des propriétés d’exogénéité des variables. 


Les variables pibr, r, Acacr et sinir sont faiblement exogènes pour les paramètres du modèle 
conditionnel si, dans le VAR présenté précédemment, leurs variations ne dépendent pas 
des écarts à l’équilibre retardés, c’est-à-dire si les coefficients O1, 42, Ol43, Ols1, Ol52, O53, 
O1, De, Oe3s 71, 72 et 73 sont nuls simultanément. 


On réalise un test de Wald afin de vérifier si les douze coefficients de la matrice & (les 
coefficients des variables par rapport auxquelles on « conditionnalise » dans le modèle 
conditionnel, qui forme une partition de la matrice a) sont nuls. Le résultat est 36,0196 et 
suit une distribution Chi-2 à 12 degrés de liberté, mais affiche une probabilité de 0,000 % 
à la droite de la valeur réalisée du test, montrant que l'hypothèse &; = 0 est rejetée. Les 
quatre variables pibr, r, Acacr et sinir ne sont pas faiblement exogènes. 


Ainsi, au lieu d’estimer seules les trois équations du modèle conditionnel, il convient de 
les estimer simultanément avec les équations du VAR des variables par rapport auxquelles 
on conditionne le modèle. 

Les résultats de l'estimation de modèle VAR à correction d’erreur conditionnel sont les 


2 


suivants pour l’équation des primes : 


Coefficient estimé Écart-type Statistique t [Probabilité 
critique] 
(es 47893 :33/10 1.421 [.155] 
ecmi(-1) -.03191 .02036 -1.567 [.117] 
ecm2(-1) 00964 .01117 0.086 [.931] 
ecm3(-1) -.15629 .23806 -0.656 [.511] 
Aprimesr+.1 .35077 . 22523 1.557 [.119] 
ACPprt+-1 -00192 .-04889 0.039 [.969] 
Adeprt-1 18779 .29787 -0.630 [.528] 
Apibre+. .39280 :59Y85 0.664 [.507] 
Art-1 .00143 -00343 0.415 [.6/8] 
A(Acacr)#-] -.03528 .01844 -1.914 [.056] 
ASsinire. -.02448 .07571 -0.324 [./46] 
Apibrt .10156 .32699 0.311 [./56] 
Art .-00309 .-00262 1.1785 [.239] 
A(Acacr}: - 00499 .01443 -0.346 [.729] 
Asinirt .06478 .04780 1.355 F784 
R?= .62791 


1. Une variable aléatoire Z, est dite « faiblement exogène » pour un paramètre 6, si elle peut être prise comme 
fixe et donnée sans causer de perte d’information lors de l’inférence sur 6. On peut ajouter, à titre de remarque, 
que si l’on a à la fois exogénéité faible et non-causalité de Granger, alors Z; est dite « fortement exogène ». 
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Parmi les quatre variables instantanées, celles du PIB, des sinistres et du rendement 
des actions ont le signe attendu. La croissance génère une hausse des primes (suite à 
l'augmentation du niveau de vie, la valeur des biens à assurer augmente, de nouvelles 
activités sont entreprises..), une hausse des rendements de l’indice boursier permet de 
diminuer les primes et une augmentation des sinistres les fait croître. Les taux d’intérêt 
à long terme semblent influencer positivement les primes. Toutefois, le coefficient n’est 
pas significatif et, dans cette équation, seule la variable relative au rendement des actions 
retardé est significative, avec le signe attendu. 


EXERCICE 5 ASSURANCE ET MODÈLE STRUCTUREL 


À CORRECTION D'ERREUR 


Énoncé 


Après avoir estimé le modèle VAR à correction d’erreur conditionnel, il faut maintenant 
estimer un modèle structurel à correction d’erreur, pour faire apparaître les relations 
contemporaines simultanées entre les variables d'intérêt (primesr, capr, depr). 


À partir du modèle à correction d’erreur conditionnel en forme réduite, on peut spécifier 
différents modèles structurels, en particulier un modèle structurel à équations simultanées 
à correction d’erreur. 


On partitionne la matrice B/ de la manière suivante : B’ — | l':B |, où l'est supposé être 
P PP 


une matrice non singulière 3 x 3, et B est une matrice 3 x 4, ce qui induit : 


B'X, —= rY, + BZ; —= Vs 


Partitionner la matrice B en deux matrices let B permet de réinterpréter les relations de 
cointégration dans une perspective de modèle structurel reliant des variables endogènes Y 
à des variables exogènes Z. Le vecteur 3 x 1v, est ainsi défini comme le vecteur des écarts 
aux équilibres à la période f. 

Les matrices let B sont identifiées moyennant des hypothèses d’identification, décrites 
par Park [PAR 1990] et Saikkonen [SAI 1991]. Les hypothèses d’identification exacte 
de B examinées précédemment valent aussi pour let B, puisque ces matrices sont une 
partition de B et, avec la nouvelle notation de $ partitionné en let B, elles peuvent se 
réécrire de la manière suivante (1) : 


! 
Fj = —1,i= 1...3 pour les hypothèses de normalisation et R; (rin) =0,i=1...3 


pour les hypothèses supplémentaires d’identification exacte. 
! 


Le vecteur (rin) est la colonne de B. Chaque matrice de restrictions R; doit être 


d'ordre 2 x 7 et de rang 2 : un vecteur de cointégration particulier est exactement identifié 
si, en plus de la restriction de normalisation, on lui impose deux restrictions linéairement 
indépendantes. 

Bien entendu, on peut également imposer, en plus des restrictions de normalisation et 
des restrictions supplémentaires d’identification exacte, des restrictions supplémentaires 


1. En l’absence de restrictions interéquations, qui seraient une autre manière d’identifier les coefficients. 
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de suridentification. C’est le cas ici si une ou plusieurs matrices R; ont plus de deux lignes 
et sont d’un ordre supérieur à 2. Seules les restrictions de suridentification peuvent être 
testées statistiquement. 


On obtient un modèle structurel à correction d’erreur en reparamétrant le modèle à 
correction d’erreur conditionnel en forme réduite de la façon suivante : on substitue 


(r 3) à B’ et l’on multiplie l’ensemble par une matrice non singulière 3 x 3 notée Lo: 


loAY; = lo (li — Z122» Wu) 
+ (Z22») AZ; + Mo (ou — 2122) 0) (TYs1 + BZy 1) 
+ (Au = 2122» An) AXs-1 + Fois 


Le nouveau vecteur de termes d’erreur &; — low» a une matrice de variance et de 
covariance à — Po (Eu ou So Z1) Fe 


On écrit le modèle structurel sous une forme plus simple : 


FoAY, = b + BoAZ, + A (TY; 1 + BZ- 1) + liAŸs 1 + BiAZR- 1 HE, 


moyennant les définitions suivantes : 


b=T (lu = Z122» M) » Bo= T0 (Z2») », A=T (ou _ 2122 0) 


où (ris) = (oi = 2122» 0) 


Ces nouvelles notations sont des matrices dont les éléments sont notés de la manière 


suivante : 
Yo,ii Yo,12  Y0,13 bi bon bo,12 bo,13 
Fo | Yoz1 Yoz2 Yozs | » b=|b; |, Bo= bo bo,22 Do,23 > 
Yo,31 Yo,32  Y0,33 b bo,31 bo,32 bo,33 
Au An À 
À — À 22 3 
31 À32 33 
YViii  Y12,  Y13,1 bin bu bis bia 
Fi | Vars Year VYasn | Bi = bai bn bis bar 
YV31,1 Y32,1  Y33,1 bai b31 b331 ban 


Le problème de l'identification de let B ayant déjà été traité, il reste à aborder celui de 
l'identification des paramètres restants : | T,:B1 | = lo (ou — Zn 23 w), qui décrivent 


les ajustements à court terme, par rapport à let à B (ceux-ci étant les paramètres des 
relations d’équilibre à long terme). À nouveau, on impose des restrictions de normalisation 
et des restrictions supplémentaires d’identification, inspirées si possible par la théorie 
économique. Les restrictions de normalisation peuvent s'exprimer de la manière suivante : 
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La sélection de restrictions supplémentaires d'identification sur les paramètres à court 
terme est difficile, car les propositions dégagées par la théorie économique portent essen- 
tiellement sur les relations d’équilibre, et expliquent généralement peu les ajustements à 
court terme. 


Il serait donc raisonnable de commencer par des restrictions d’identification exacte 
théoriquement plausibles, dans la perspective d'appliquer éventuellement ensuite, au vu 
des résultats, des restrictions supplémentaires de suridentification « testables ». On met en 
oeuvre ici la méthode proposée initialement par Boswijk [BOS 1992], qui suggère de faire 
les restrictions d’identification exacte qui contraignent la matrice À à être diagonale : 


kun 0 0 
A=| 0 x 0 
(ù 0  À33 


Pour chacune des trois équations, on impose donc deux restrictions sur les coefficients, 
en l’occurrence des restrictions de nullité. Avec la restriction de normalisation, on dispose 
donc de trois restrictions, qui permettent l’identification exacte. 


Avec toutes ces restrictions d'identification exacte, le modèle structurel à correction 

d’erreur à estimer est donc : 

Aprimesr; = bi — You2 Achr: — Yo13 Adepr; 
+ bou Apibr, + bou Aoblr, + bo 13 A? cacr, + bonasinir, 
+ (Bzicpri-1 + Bsidepri-1 + Bsroblrs_1 + Bei Acacr;_1 + sinir:_1 — primesr:_1) 
+ Yu Aprimesrs-1 + Via Acprs-1 + Yi131 Adepri-1 
+ bu Apibrs_1 + bia Aobir; + bi31 A?cacrs_1 + bia Asinir_1 + Er 

Acpr; = b2 — Yon Aprimesr, — Yo23 Adepr, 

+ bo Apibr, + bo,»2 Aoblr, + bo33 A? cacr, + bopasinir, 


+ 2 (Biaprimesr;_ + Bs2depr;_1 + Be Acacr;_1 + Brisinir;-1 — cpri-1) 

+ Ya Aprimesrs_1 + Y221 Ari + Y231 Adeprs à 

+ ba Apibr;_1 + bo1 Aobir; + b231 A?cacrs_à1 + ban Asinir_1 + Er 
Adepr; = b3 — Yo31 Aprimesr, — Vo,32 Acpr: 

+ boa1 Apibr; + bo32 Aobir, + bo33 A?cacr; + bosasinir, 

+3 (B2scpri-1 + Bssdepri_1 + Baspibri_1 + Brssinirs_1 — depri_1) 

+ Y311 Aprimesr;_1 + V321 Acprs-1 + Y331 Adeprs-1 

+ ban Apibr;_1 + b321 Aobir, + b331 A?cacrs_1 + baaa Asinirs_1 + Es 


Si l’on estime des équations exprimant des variables X conditionnellement à des variables 
L, ces dernières sont faiblement exogènes pour les paramètres de ces équations condi- 
tionnelles (modèle VAR conditionnel structurel) s'ils sont libres en variation vis-à-vis des 
paramètres des équations du processus de L. Dans ce cas, on ne perd pas d’information sur 
les paramètres des équations conditionnelles des variables X en négligeant les équations 
du processus des variables L. 

Pour les données utilisées ici, puisque les variables pibr, r, Acacr, sinir ne sont pas 
faiblement exogènes, on estime les trois équations conditionnelles, non pas seules, mais 
simultanément avec les équations du VAR des variables par rapport auxquelles on condi- 
tionne. 
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Tableau 6.10 


Équation de 
Aprimesr, 


Il faut aussi tenir compte du problème de l'identification des paramètres structurels. Pour 
qu'un système soit identifié, le nombre de variables prédéterminées (exogènes ou bien 
endogènes retardées) exclues de chaque équation structurelle doit être au moins égal au 


nombre de variables endogènes présentes dans l 


une. 


quation structurelle considérée, moins 


On estime ici un modèle conditionnel structurel identifié par maximum de vraisemblance, 
tenant compte de l'absence d’exogénéité faible des quatre variables pibr, r, Acacr et sinir. 
Les résultats pour l'équation des primes sont les suivants : 


Variable 


C 
Aprimesr+.1 
Adepr+. 
Art-i 
Asinirs- 
ecmi(-1) 
ACPprt+ 
Adeprt+ 

Art 
A(Acacr)} 


Asinirt+ 


Coefficient estimé 


0.94608 
-0.32090 
0.05581 
.02593 
.16256 
.50207 
-0.48800 
1.47850 
0.00264 
-0.15949 
-0.15974 


' 
[e} 


Écart-type 


0.93881 
0./77698 
0.93699 
.-02266 
.27011 
0.53247 
0.66052 
.95830 
.-06627 
.39115 
. 76820 


Statistique 


1.008 
-0.413 
0.060 
-1.144 
-0.602 
-0.943 
-0.739 
0.755 
0.040 
-0.408 
-0.090 


[Probabilité 
critique] 
0.325 
0.684 
0.953 
0.265 
0.553 
0.356 
0.468 
0.458 
0.969 
0.687 
0.929 


Dans ce modèle structurel conditionnel, une hausse des rendements boursiers permet de 
diminuer le montant des primes, alors qu’une hausse des dépenses l’accroît. On retrouve 
également un résultat fondamental, qui va dans le même sens que la relation à long terme: 
une baisse des capitaux propres entraîne une hausse des primes (capacité contrainte). 
Toutefois, les coefficients sont peu significatifs. 
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Ce chapitre traite de deux types de modélisation 
développés dans le but d'analyser des problèmes bien 
particuliers : d'une part les modèles qui permettent 
d'expliquer des choix entre plusieurs options ; d'autre 
part, les modèles développés spécifiquement pour 
représenter la dynamique de la volativité des séries 
financières. Dans la première partie de ce chapitre, la 
variable à expliquer est donc discrète ; elle ne peut 
prendre que quelques valeurs seulement, 
correspondant aux différentes options. La deuxième 
partie du chapitre traite des modèles à volatilité 
variable, particulièrement adaptés à la modélisation 


des rendements des actifs financiers. 
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El Les modèles à variables dépendantes 


1.1 


discrètes 


CHOIX ENTRE PLUSIEURS OPTIONS 


Chaque individu à doit faire un choix entre J options différentes (j = 1,2...J). Pour 
chaque individu 1, et pour chaque option j, on dispose d’un vecteur w;; des caractéristiques 
de l’option j telles qu’elles sont perçues par lindividu 5. Dans les cas particuliers où les 
caractéristiques perçues de l’option j sont identiques, quel que soit l'individu 5, Pindice à 
devient inutile : w; = w; pour tout 1. 
Pour chaque individu i, on dispose également d’un vecteur /; des caractéristiques propres 
à cet individu. 
Pour un individu particulier ; et une option particulière j, on dispose donc d’un vecteur de 
caractéristiques observées z;; tel que z;; = (wi;l:)". Dans certains cas, ce vecteur se ramène 
simplement à Zi; = (WE). 
L'utilité qu'un individu i retire de l'option j est notée U;;. On suppose que cette utilité 
dépend des caractéristiques rassemblées dans z;; et d’un facteur aléatoire (ce dernier tenant 
compte du fait qu’il est impossible d’identifier et d'observer tous les facteurs qui influent 
sur les choix d’un individu) : 

5 =P'z;+e; (7.1) 


où e; est une composante aléatoire, et donc une variable aléatoire, qui n’est pas observable. 
Son espérance est supposée nulle. Le vecteur B rassemble les coefficients qui mesurent 
l'impact de chaque variable de z;; sur l'utilité U;. 
L'individu i choisit j quand Putilité qu’il retire de l’option j est supérieure aux utilités qu’il 
retire de chacune des autres options : 
Dire que « le choix de i est l’option j » équivaut à dire : 
+ U; > Ux pour tout k £ j 
- ou encore, P'z; +e; > B'zx + ex pour tout k £ j 
- ou encore, Ex — Eÿ < B'zj — B'zx pour tout k £ j 
La probabilité P;; que le choix de l’individu ; se porte sur l’option j est donc la probabilité 
que l'utilité qw’il retire de j soit supérieure à lutilité qu’il retire de n'importe quelle autre 
option : 

Pj = P(eix — eÿ < B'z; —B'zx pour tout k £ j) 
ou encore : 


P; = P(Eÿx — Eiÿ < P(z — Zik) pour tout k Æ j). (7.2) 


Dans le cas particulier où le nombre d’options s’élève à deux (J = 2), c’est-à-dire quand 
les choix d’un individu i ne peuvent porter que sur j = 1 ou j = 2, la probabilité P; que 
le choix de l’individu i se porte sur l'option 1 est la probabilité que l’utilité qu’il en retire 
soit supérieure à l’utilité qu’il retire de l'option 2 : 


Pi = Pen — ex < B'(z1 — za) 


ou encore 
Pa = PE — en < B'Z1) = G(B'Za) = G(B'Z;) (7.3) 
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où ZA est une manière de redéfinir les caractéristiques conjointes de l’option 1 et de 


l'individu ;, en les définissant par rapport à celles de l'option 2 : 
Zù = Zi = za — Zn (7.4) 


et où G(.) est la fonction de distribution cumulée (ou fonction de répartition) de la 
variable aléatoire £;) — £; : 
G(x) = P(E2 — En < x) (7.5) 


1.2 MODÈLE PROBIT 


Quand le nombre d’options s'élève à deux (J = 2)et si la variable aléatoire &;> — 8; 
suit une distribution normale, G(x) — 27)" 2 (e)_ cne D(x). La probabilité que 
l'individu j fasse le choix de l'option 1 (au Teu de la 2) s'écrit alors : 
B'Zi : 
I REP 
Pa = 082) = | QT À F hdp (7.6) 
— 
Cette probabilité est une fonction bien définie des caractéristiques observées rassemblées 
dans le vecteur Z;,. Les coefficients de cette fonction sont bien sûr inconnus et inob- 
servables, mais on peut les estimer par une technique économétrique appropriée, pourvu 


que l’on dispose d’un échantillon d'observations du choix et des caractéristiques d’un 
ensemble d'individus différents. Une fois que les coefficients du vecteur B sont estimés 


par des valeurs estimées B, on peut alors appliquer la fonction (Ba) pour estimer à 


l'avance la probabilité qu’un nouvel individu quelconque fasse le choix de l'option 1, en 
fonction des valeurs observées de ses caractéristiques Z:1. 


Les estimateurs B sont les valeurs de B qui maximisent la fonction de vraisemblance /(B) 
définie par : 


1(B) = Zn ( In (® (B°Z;)) + » | (1— y;)In(1— œ(8/Z;)) (7.7) 
il 
où y; = 1 quand l'individu ; fait le choix de l’option 1, et y; = 0 quand il choisit la 2. 


Une estimation de la matrice de variance et de covariance de B est fournie par : 


SN JL POMENNT | (6 (8z)) . 
(8) _ ( (e)) 2 æ (BZ) (1- (82) ZiZ; (7.8) 


On prouve mathématiquement, sans difficulté, l'égalité de droite. 


Une fois l’estimation réalisée, on définit des valeurs calculées ÿ; de la façon suivante : 
ÿ,=1 quand ® (f;Z;) > 0,5 
ÿ:=0 quand © (84) < 0,5 


Pour un individu particulier, la valeur ÿ; représente donc son choix « tel qw’il est impliqué 
par le modèle », que l’on peut comparer avec son vrai choix observé y;. 
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1.3 MODÈLE LOGIT 


Quand le nombre d'options s’élève à deux (J = 2) et si la variable aléatoire €; — € suit 
1 X 
une distribution logistique, G(x) = —— — @ . La probabilité que l’individu 5 
1+(e)*  1+(e)* 
fasse le choix de l’option 1 (au lieu de la 2) s’écrit alors : 


1 (e)PZi 


P; —= 7 _— 7 
1 1H) PA 1+ (eZ 


= A(BZa) (7.9) 


Cette probabilité est une fonction bien définie des caractéristiques observées rassemblées 
dans le vecteur Z;,. Les coefficients de cette fonction sont bien sûr inconnus et inob- 
servables, mais on peut les estimer par une technique économétrique appropriée, pourvu 
que l’on dispose d’un échantillon d’observations du choix et des caractéristiques d’un 
ensemble d'individus différents. Une fois que les coefficients du vecteur B sont estimés 


par des valeurs estimées B, on peut alors appliquer la fonction A (B Za) pour estimer à 


Pavance la probabilité qu’un nouvel individu i quelconque fasse le choix de l’option 1, en 
fonction des valeurs observées de ses caractéristiques Z;1. 


Les estimateurs B sont les valeurs de B qui maximisent la fonction de vraisemblance /(B) 
définie par : 


1(B) = yin(A(BZ))+ 9 (1-y;)In(1-— A (BZ)) (7.10) 
i=1 i=1 

où y; = 1 quand l’individu i fait le choix de l’option 1, et y; = 0 quand il fait le choix de 

la 2. 

Une estimation de la matrice de variance et de covariance de B est fournie par : 


fe 921(B)\\ 
ne (Cr) ne 


= (A(Bz)(-a(6z))zz van 
É i=1 
Après avoir estimé le modèle, on définit des valeurs calculées ÿ, de la manière suivante : 
ÿ.=1 quand À (B:z) > 0,5 
ÿ,=0 quand A (B:z:) < 0,5 


Pour un individu particulier, la valeur ÿ; représente donc son choix « tel qw’il est impliqué 
par le modèle », que l’on peut le comparer avec son vrai choix observé y:. 


1.4 DIAGNOSTICS SUR LA QUALITÉ D'AJUSTEMENT DES MODÈLES LOGIT 
ET PROBIT 


Que l’on estime un modèle Probit ou Logit, on peut obtenir quelques résultats et tests à 
interpréter, sachant que la disponibilité de ces statistiques s’avère très variable d’un logiciel 
à l’autre : 

+ La valeur maximisée de la fonction de vraisemblance : / (8). 


+ Le critère d’Akaike : [ (8) — k. 
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ak 
+ Le critère bayesien de Schwarz : ! (8) ES In(n). 


- Le critère de Hannan-Quinn : / (8) — kIn(In(n)). 


Ces critères permettent de comparer des modèles différents pour expliquer des choix y; 
identiques, et de sélectionner celui pour lequel le critère est le plus élevé. 


+ La statistique de Pesaran-Timmermann : PTTEST (y, ÿ). 


Dans cette fonction, y est le vecteur de tous les y; et Ÿ est le vecteur de tous les ÿ:. PTTEST 
est un test non paramétrique d’association entre deux variables aléatoires. Si ces deux 
variables sont indépendantes, PTTEST suit une N(0, 1) pour de grands échantillons. 
Par conséquent, après l’estimation d’un modèle Probit ou Logit, cette statistique permet 
de tester l'hypothèse que le modèle n’explique absolument pas les choix observés, c’est- 
à-dire que les choix prévus par le modèle n’ont aucun lien avec les choix réels observés. 
Quand on rejette cette hypothèse, cela signifie que le modèle arrive à expliquer au moins 
partiellement les choix observés. 

La mesure de qualité de l’ajustement statistique : + SU 

La fonction sign(x) vaut 1 quand x > 0 et vaut 0 quand x < 0. Pour un individu 
particulier, la fonction sign (ÿ;y:) vaut donc 1 quand le choix ÿ; prévu par le modèle 
est correct, c’est-à-dire égal au vrai choix y;. Dans le cas contraire, sign (ÿy:) = 0. La 
mesure de qualité de l’ajustement statistique représente donc le pourcentage d'individus 
pour lesquels le modèle prévoit correctement le choix. 


Le pseudo-R?, qui mesure la qualité de l’ajustement statistique : 1 — I(B)/E(Bo). 

La fonction /(Bo) représente la valeur maximisée de la fonction de vraisemblance quand 
on contraint tous les coefficients à être nuls, sauf la constante. Le pseudo-R? est compris 
entre 0 et 1 et est d'autant plus proche de 1 que le modèle est explicatif. 


La statistique Chi-2 : 2(1(È) — 1(Bo)). 
Si les coefficients de toutes les variables explicatives sont nuls, cette statistique suit 


asymptotiquement une Chi-2 à k — 1 degrés de liberté si BZ; contient une constante et 
à k degrés de liberté dans le cas contraire. 


1.5 MODÈLE LOGIT MULTINOMIAL 


Ce modèle décrit le choix entre J options différentes en supposant que les ex, pour 
k = 1...J, suivent des lois de Weïbull indépendantes. Il en résulte que la probabilité de 
choisir l'option j est donnée par : 
Zi 
Pi = ——— (7.12) 


J / 
B'Zik 
He) 


Lorsque J — 2, le modèle Logit multinomial équivaut au modèle Logit. La version 
multinomiale présentent des limites clairement identifiables : ce modèle implique que 
le rapport entre les probabilités de choisir deux options différentes est indépendant 
de l’existence d’autres options. Si J augmente suite à l'ajout de nouvelles options, les 
probabilités de choix des options initiales changent, mais restent dans un même rapport. 
Cette propriété semble irréaliste dans beaucoup de problèmes réels, et limite donc les 
opportunités d'utilisation du modèle. 
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F1 Les modèles à volatilité conditionnelle 
autorégressive 


Les modèles à volatilité variable sont particulièrement adaptés à la modélisation des ren- 
dements des actifs financiers. Lorsqu'on observe une série temporelle financière de haute 
fréquence (variation du taux de change, du cours boursier...), on remarque généralement 
que sa volatilité, représentée statistiquement par la variance, n’est pas constante dans le 
temps, en d’autres termes, que sa variance change dans le temps. Le processus sous-jacent 
révèle donc une hétéroscédasticité(), En général, on constate que des périodes assez 
longues où la volatilité est faible sont suivies de périodes assez longues où elle est forte. 
En fait, des dates où la volatilité est faible ont tendance à se succéder, et des dates où 
elle est forte ont également tendance à se suivre. On dit également que la volatilité, ou la 
variance du processus, est autorégressive : elle dépend de ses valeurs passées. Les processus 
ARCH(p) et GARCH(p, q) sont définis de manière à pouvoir représenter ce type de série 
observée. 


2.1 LES PROCESSUS ARCH(p) 


Un processus ARCH (p} est un processus à hétéroscédasticité conditionnelle autorégressive 


d'ordre p. 
Un processus stochastique {X,} est un processus ARCH(p) quand : 
X=u+e, 
où bed Ds N(0, hs) 


P 
avec h; = 0 + ) oE?_; sous la condition a; > 0 pour tout i 


i=1 


Ce processus {X,} est donc tel que : 


exe. Nu, hs) 


p 
avec À; = do + >. a; (X;-; — mu)” sous la condition a; > 0 pour tout i 


1 


La distribution conditionnelle de X,, conditionnellement à ses valeurs passées, a ainsi une 
variance qui dépend des valeurs passées de X,. 


L'espérance conditionnelle de X; est fournie par : 


EX; 1X5 1 ,X52,...) = Vt 


La variance conditionnelle de X, est fournie par : 


VX IX 1, Xe...) = h Vt 


1. Le chapitre 7 traite de l’hétéroscédasticité (variation de la variance dans le temps) d’un type particulier de 
processus stochastique : le terme d’erreur inobservable d’un modèle linéaire. Dans ce chapitre, on s'intéresse à 
Phétéroscédasticité d’un processus stochastique observable. 
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La distribution conditionnelle de X, à son passé est normale : 


Fée  N(u, h5) 
Mais la distribution non conditionnelle, ou marginale, de X; ne l’est pas : 
fx ZN 
L'espérance non conditionnelle de X; est fournie par : 
EX)=n 


La variance non conditionnelle de X, est fournie par : 


(1) 
P 
1 — ) ._. Oi 
1=1 


; x P —i D: 
quand toutes les racines du polynôme en I, ) : a;L?"", sont en dehors du cercle unité. 
1= 


VOX) = 


Remarque : le processus X, peut s’écrire ainsi : 
X;=u+W,U, où U; — N(0,1) Vt 
et est indépendant d’une période à l’autre : 


1 
2 


P 
W, = Lao + > Qi (Xs-; — LL) 


1=1 


Exemple (Processus ARCH(1)) 
Xr=U+e 
OÙ fx 1x2, 7 N(O hr) avec hi = oo + œiEé_ 


et donc : 
D di NU, he) 


avec h; = do + ox (X;-1 — 1)? 


2.2 LES PROCESSUS GARCH(p, a) 


Il s’agit d’une généralisation d’un processus ARCH(p) : 
X=u+e, 


p q :, à 
OUR eo. + N(0, h;) avech, = do+) et), B;h;-_; sousles conditions 
ai > OetB; > 0 pour tout 1. 
X, est donc un processus tel que : 


fab Nu, h5) 


P q 
avec hi, = do+ D (Xi H)? + He Bjhs; 
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On montre que cela implique que e? suit un processus ARMA(m, q) avec m = max(p, q) : 


m q 
e? = Oo + Da (ot; + B;) CR +; — D Bu OÙ Us — A — h; 


1=1 = 


Exemple (Processus GARCH(1, 1)) 
X=U+e 


OÙ fx 1x2, © NO, hr) avec h; = ao + 62 1 + Bih-1 et donc : 
Fee Éd NU, hs) 


avec h; = a + où (X5-1 — fa)? + Bis 


Exemple (Cas particulier des processus GARCH(1, 1) 
ou processus IGARCH(1, 1)) 


Lorsque do = 0, &1 + B1 = 1, on parle de GARCH intégré ou IGARCH(I, 1) : 
hr = 00 + ae? ; + (À — œ) hi 


ce qui implique : 
Elhr40 les Ei-1,...) = hi VO 21 


La variance conditionnelle h; se caractérise par une racine unitaire. 


Résumé 


Les modèles présentés dans la première partie de ce chapitre servent à expliquer 
les choix des individus entre plusieurs options. Si les choix se limitent à deux 
options, on utilise les modèles Probit ou Logit. Pour expliquer des choix entre 
un plus grand nombre d'options, on peut utiliser le modèle Logit multinomial. 
Ces modèles expliquent la probabilité de choisir une option en fonction d’une 
série de variables représentant des propriétés du décideur ou des options en 
présence. On trouve des informations complémentaires utiles sur ces modèles 
chez McFadden (1976). Les modèles à volatilité conditionnelle autorégressive 
permettent quant à eux de représenter l’évolution de nombreuses séries finan- 
cières. Ces séries se caractérisent par une autocorrélation significative de leur 
volatilité alors que leur niveau ne semble pas autocorrélé. Pour des informa- 
tions supplémenatires sur ces modèles il est intéressant de lire Bollerslev, Chou 
et Kroner [BOL 1992], Pederzoli [PED 2003] et Taylor [TAY 1986] [TAY 19941. 
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et exercices 


EXERCICE | PRENDRE LA DÉCISION D'UTILISER DES ENGRAIS AVEC TSP 


Énoncé 


On dispose de données concernant des agriculteurs : une partie d’entre eux a choisi 
d’utiliser des engrais et une autre partie a choisi de ne pas en utiliser. Ces données sont 
dans le fichier ENGRAIS.xIs, téléchargeable sur le site www.pearsoneducation.fr, et lisible 
par TSP. 


Pour chacun de ces agriculteurs, on définit les variables suivantes : 
+ ENGRAIS vaut 1 en cas d’utilisation d’engrais et 0 sinon. 
+ DETTE mesure le montant du crédit (par hectare). 


+ DISTANCE mesure la distance qui sépare l'exploitation considérée du marché le plus 
proche. 


+ EXPERT mesure les heures de discussion entre l’agriculteur et un expert agricole. 


+ IRRIG est une variable binaire qui vaut 1 quand des techniques d’irrigation sont utilisées 
et 0 dans le cas contraire. 


+ PROPR est une variable binaire qui vaut 1 quand l’agriculteur est propriétaire de 
l'exploitation et 0 dans le cas contraire. 


Pour chaque individu ;, le vecteur Z; est défini de la manière suivante : 


1 
DETTE; 
DISTANCE; 
Zh = ; x = (1DETTE;DISTANCE;EXPERT ;IRRIG;PROPR;) 
EXPERT, 
IRRIG; 
PROPR; 
Expliquez pourquoi un agriculteur fait le choix d’utiliser des engrais. Réalisez cet exercice 
avec TSP. 
Le modèle doit expliquer la probabilité d'utiliser des engrais par les valeurs des variables 


explicatives observées. 


Probit explique cette probabilité de la manière suivante : 


P(ENGRAIS; = 1) = D(B'Z;) = D(B: + BDETTE,; + B3DISTANCE, + B4EXPERT; 
+ BSIRRIG; + B6PROPR:), pour tout i = 1,2... 398 
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De son côté, Logit l’explique ainsi : 


P(ENGRAIS; = 1) = A(B/Z;) = A(B: + B>DETTE; + B:DISTANCE; + B4EXPERT; 
+ BSIRRIG; + BéPROPR;), pour tout i = 1,2... 398 


L'estimation des modèles Probit et Logit se fait au moyen du programme suivant : 


freq n; 

smpl 1 398; 

read(file=‘c:\engrais.x1s’); 

probit engrais c distance dette irrig propr expert; 
logit(nchoice=2) engrais c distance dette irrig propr expert; 


Ce programme fournit les résultats suivants : 


Equation 1 


Probit ESTIMATION 
Working space used: 6115 


STARTING VALUES 


C DISTANCE DETTE IRRIG 
VALUE 0.00000 0.00000 0.00000 0.00000 
PROPR EXPERT 
VALUE 0.00000 0.00000 
F= 275.87 FNEW= 217.13 ISQ/Z= O0 STEP= 1.0000 CRIT= 108.84 
F= 217:18 FNEW= 215.27 ISQ/Z= O0 STEP= 1.0000 CRIT= 3.2874 
F=. :216:27 FNEW= 214.91 ISQZ= O0 STEP= 1.0000 CRIT= 0.63129 
F= 214.91 FNEW= 214.89 ISQZ= O0 STEP= 1.0000 CRIT= 0.33882E-01 
F= 214.89 FNEW= 214.89 ISQ/Z= O0 STEP= 1.0000 CRIT= 0.89120E-04 
F= 214.89 FNEW= 214.89 ISQZ= O0 STEP= 1.0000 CRIT= 0.54649E-09 
CONVERGENCE ACHIEVED AFTER 6 ITERATIONS 
12 FUNCTION EVALUATIONS. 
Dependent variable: ENGRAIS 
Number of observations = 398 Scaled R-squared = .256259 
Number of positive obs. = 159 LR (zero slopes) = 105.771 [.000] 
Mean of dep. var. = .399497 Schwarz B.I.C. = 232.851 
Sum of squared residuals = /1.6068 Log likelihood = -214.892 
R-squared = .250057 
Fraction of Correct Predictions = 0./33668 
Standard 
Parameter Estimate Error t-statistic P-value 
C -1.05029 .141593 -7.41767 [.000] 
DISTANCE -4012237 .012212 -1.00206 [.316] 
DETTE .153616E-03 ./26164E-04 2.115465 [.034] 
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IRRIG 1.16777 .143337 8.14703 C.000] 
PROPR .308972 .145839 2.11859 [.034] 
EXPERT .016280 .8/7813/7E-02 1.85393 C.064] 


Standard Errors computed from analytic second derivatives 
(Newton) 


dP/dX 

0 1 

C 0.32091 -0.32091 

DISTANCE 0.0037389 -0.0037389 

DETTE -0.000046936 0.000046936 

IRRIG -0.35680 0.35680 

PROPR -0.094403 0.094403 

EXPERT -0.0049742 0.0049742 
Equation 2 


MULTINOMIAL Logit ESTIMATION 


Choice Frequency Fraction 
0 239 0.6005 (coefficients normalized to zero) 
1 159 0.3995 


Working space used: 6961 


STARTING VALUES 


C1 DISTANCEI DETTE TRRIGI 
VALUE 0.00000 0.00000 0.00000 0.00000 
PROPRI EXPERTI 
VALUE 0.00000 0.00000 
F= 275.87 FNEW= 217.58 ISQZ= O0 STEP= 1.0000 CRIT= 108.84 
F= 217.58 FNEW= 215.21 ISQZ= O0 STEP= 1.0000 CRIT= 4.1360 
F= 215.21 FNEW= 214.77 ISQZ= O0 STEP= 1.0000 CRIT= 0./75344 
F= 214.77 FNEW= 214.73 ISQZ= O0 STEP= 1.0000 CRIT= 0./75332E-01 
F= 214.73 FNEW= 214.73 ISQZ= O0 STEP= 1.0000 CRIT= 0.52623E-03 
F= 214.73 FNEW= 214.73 ISQZ= O0 STEP= 1.0000 CRIT= 0.21469E-07 
CONVERGENCE ACHIEVED AFTER 6 ITERATIONS 
12 FUNCTION EVALUATIONS. 
Dependent variable: ENGRAIS 
Number of observations = 398 Scaled R-squared = .257015 
Number of positive obs. = 159 LR (zero slopes) = 106.095 [.000] 
Mean of dep. var. = .399497 Schwarz B.I.C. = 232.689 
Sum of squared residuals = 71.5015 Log likelihood = -214.730 
R-squared = .251146 
Number of Choices = 796 
Fraction of Correct Predictions = 0.731156 
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Standard 

Parameter Estimate Error t-statistic P-value 
C1 =1;76171 .254221 -6.89048 [.000] 
DISTANCET -.022378 .022533 993113 [.321] 
DETTE .269173E-03 .133790E-03 2.01190 [.044] 
IRRIGI 1.928085 .245219 7.86259 [.000] 
PROPRI .52817/6 .246712 2.14086 [.032] 
EXPERTI .029987 .016441 1.82389 [.068] 
Standard Errors computed from analytic second derivatives 


(Newton) 
dP/dx 
0 l 
Ç 0.31601 -0.31601 
DISTANCE 0.0040369 -0.0040369 
DETTE -0.000048559 0.000048559 
IRRIG -0.34782 0.34782 
PROPR -0.095283 0.095283 
EXPERT -0.0054096 0.0054096 


Pour chacune des méthodes Probit et Logit, on dispose d’un tableau avec une colonne 
Estimate, qui reprend les coefficients B; estimés pour chaque variable de la colonne Para- 
meter. Les coefficients estimés par les deux méthodes sont assez proches. Les coefficients 
de la plupart des variables sont estimés avec une grande précision. Ils sont en effet très 
significatifs, avec des statistiques f élevés et des p-values faibles, sauf pour la variable 
DISTANCE. Pour les autres variables, sauf EXPERT, on rejette l'hypothèse de nullité 
du coefficient B; à un seuil de signification de 5 % puisque leur p-value est inférieure à 
0,05. Pour EXPERT, la probabilité critique du test Student indique que l’on ne rejette 
Phypothèse de nullité du coefficient B; qu’à un seuil de signification supérieur à 6,8% 
dans l’estimation du modèle Logit. Les tableaux dP/dX indiquent, pour chaque variable 
explicative, dans la colonne de droite (affichant 1 en en-tête), l'impact marginal d’une 
augmentation de la variable sur la probabilité d’utiliser de l’engrais. Plusieurs observations 
sont à faire au sujet des déterminants de cette probabilité : 


+ Elle est d'autant plus faible que la distance entre l’exploitation et le marché est grande : 
il est inutile d’utiliser des engrais pour produire davantage si l’on ne peut se rendre sur 
un marché pour y écouler la production sur le marché. 


+ Elle augmente avec le niveau d’endettement de l’exploitant : un agriculteur très endetté 
a besoin de produire et de vendre davantage pour pouvoir rembourser. 


+ Elle augmente avec Le temps passé à discuter avec un expert qui explique les avantages 
à utiliser de l’engrais. 


+ Elle augmente si l’agriculteur est propriétaire de la parcelle : il est alors davantage 
impliqué. 

+ Elle est aussi plus forte quand la parcelle est irriguée : l'irrigation favorise l’utilité de 
l’engrais. 


La statistique R-squared correspond au pseudo-R?. La statistique LR (zero slopes) est le 
test statistique Chi-2. 
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EXERCICE 2 PRENDRE LA DÉCISION D'UTILISER DES ENGRAIS AVEC EASYREG 


Énoncé 
Solution 


Estimez à nouveau les modèles de choix d’utilisation d’engrais avec le logiciel Easyresg. 


Lecture des données 


Ouvrez le fichier ENGRAIS.xls avec EXCEL, cliquez sur Fichier puis sur Enregistrer sous, 
et sélectionnez CSV (séparateur point-virgule) pour le type de fichier. Laissez Disque local 
C:\ dans la zone Enregistrer dans et conservez UKL comme nom de fichier. Cliquez sur 
Enregistrer. Le logiciel fabrique alors un fichier ENGRAIS.csv dans C:\. Ouvrez Easyreg et 
cliquez successivement sur File/Choose an input file/Choose an Excel file in CSV format. 
Dans la fenêtre Guided tour qui apparaît, cliquez sur la réponse de votre choix; si vous 
demandez le Guided tour, il faut ensuite réduire la fenêtre Guided tour on importing 
Excel files in CSV format pour pouvoir continuer à travailler avec Easyreg (et voir la 
fenêtre About CSV files). Dans la fenêtre About CSV files, cliquez sur Continue. Dans la 
fenêtre Find a CSV file qui s'affiche, sélectionnez Manually dans Search options, C: dans 
Choose drive, et C:\ dans Choose drive/directory. Cochez Double-click to choose file and 
continue. Double-cliquez sur C:\ engrais.csv dans Files found. La fenêtre Data type of 
the CSV file apparaît. Cochez Annual time series, même si les données sont journalières. 
Saisissez 1 dans Year of first observation et cliquez sur OK. Cliquez sur Confirm. Cliquez 
sur Continue. L'écran Analyzing the CSV file s'affiche. Cliquez sur Code OK. La fenêtre 
Data written to files apparaît. Cliquez sur Continue. La fenêtre Check the data lui succède. 
Cliquez sur Continue. Sur About the start-up folder EASYREG.DAT, cliquez sur Continue. 
Choose drive and folder to start-up EasyReg apparaît. Sélectionnez C:\. Ensuite saisissez 
par exemple ENGRAIS dans Make a new sub-folder in the Current folder — Enter the 
folder name, et cliquez sur OK. Cliquez sur Start Easyreg in current folder. 


Estimation des modèles 


Cliquez successivement sur Menu/Single equation models/Discrete dependent variable. 
Dans la fenêtre Guided tour qui apparaît, cliquez sur la réponse de votre choix; si vous 
demandez le Guided tour, il faut ensuite réduire la fenêtre Guided tour on discrete 
dependent pour pouvoir continuer à travailler avec Easyreg. Dans la fenêtre Select all 
variables in your limited, double-cliquez sur les variables EXPERT, DISTANCE, IRRIG, 
DETTE, PROPR et ENGRAIS. Ensuite, cliquez sur Selection OK, puis sur NO en réponse 
à la question Do you want to use a subset of observations, et sur Continue. Dans la 
fenêtre Select the dependent (Y) variable in your limited dependent, double-cliquez sur 
ENGRAIS. Ensuite cliquez deux fois sur Continue. 


Dans la fenêtre Select the independent (X) variables, double-cliquez sur EXPERT, DIS- 
TANCE, IRRIG, DETTE, PROPR. Cliquez sur Selection OK. Dans la fenêtre Select laggeg 
dependent Y variables as X variables, cliquez sur Skip all. Dans la fenêtre Select (lagged) 
independent variables, double-cliquez sur EXPERT, puis cliquez sur Selection OK. Dans la 
fenêtre Select (lagged) independent variables, double-cliquez sur DISTANCE, puis cliquez 
sur Selection OK. Dans la fenêtre Select (lagged) independent variables, double-cliquez 
sur IRRIG, puis cliquez sur Selection OK. 


Dans la fenêtre Select (lagged) independent variables, double-cliquez sur DETTE, puis 
cliquez sur Selection OK. Dans la fenêtre Select (lagged) independent variables, double- 
cliquez sur PROPR, puis cliquez sur Selection OK. Dans la fenêtre Select deterministic X 
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variables, cliquez sur Continue. Dans la fenêtre Model variables, cliquez de nouveau sur 
Continue. Dans la fenêtre Discrete dependent variable, cliquez sur Logit. Vous obtenez 
les résultats suivants : 


Logit model: 
Dependent variable: 
Y = ENGRAIS 


Characteristics: 


ENGRAIS 
First observation = 1 
Last observation = 398 


Number of usable observations: 398 

Minimum value: 0.0000000E+000 

Maximum value: 1.0000000E+000 

Sample mean: 3.9949749F-001 

This variable is a zero-one dummy variable. 
À Probit or Logit model is suitable. 


X variables: 


X(1) = EXPERT 
X(2) = DISTANCE 
X(3) = IRRIG 
X(4) = DETTE 
X(5) = PROPR 
X(6) = 1 


Frequency of y = 1:39.95 % 

Frequency of y 0:60.05 % 

odel: P(Y=1]x) = F(b(1)x(1)+..+b(6)x(6)) 

Chosen option: F(u) = 1/[1+EXP(-u)] (Logit model) 

ewton iteration succesfully completed after 6 iterations 
Last absolute parameter change = 0.0000 

Last percentage change of the likelihood = 0.0000 


aximum likelihood estimation results: 


Variable L estimate of b(.) (t-value) 
X(CL)=EXPERT b(1)=  0.0299873 (1.82) 
[p-value = 0.06817] 
x(2)=DISTANCE b(2)= -0.0223412 (-0.99) 
[p-value = 0.32127] 
Xx(3)=IRRIG b(3)=  1.9280423 (7.86) 
[p-value = 0.00000] 
x(4)=DETTE b(4)=  0.0002692 (2.01) 
[p-value = 0.044274] 
X(5)=PROPR b(5)=  0.5281730 (2.14) 
[p-value = 0.03229] 
x(6)=1 b(6)= -1.7518778 (-6.89) 
[p-value = 0.000007] 
[The two-sided p-values are based on the normal approximation] 


Log likelihood: -2.14730755414E+002 
Sample size (n): 398 


If the model is correctly specified then the maximum likelihood 
parameter estimators b(1),.., b(6), minus their true values, times the 
square root of the sample size n, are (asymptotically) jointly normally 
distributed with zero mean vector and variance matrix : 
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1.07591140E-01 8.01242020E-03 - 
-1.48/712326E-01 

8.01242020E-03 2.01931/16E-01 1 
-1.02391613E+00 

-1.35148898E-01 1.52168/97E-01 
-1.55812324E+01 
-9.13439369E-05 -1.22568933E-04 
-2.17737458E-03 
-1.17/57/71981E-01 -1.80605555E-01 
-1.09274144E+01 


-1.48712326E-01 -1.02391613E+00 -1.55812324F+01 -2.17737458E-03 -1.09274144F+01 


2.57228252E+01 


1.35148898E-01 -9.13439369E-05 -1.1/5/1981E-01 


.52168797/E-01 -1.22568933E-04 -1.80605555E-01 


2.39329261E+01 -9.19966801E-04 2.90660897E+00 


-9.19966801E-04 7.12404487E-06 1.88806501E-03 


2.90660897E+00 1.88806501E-03 2.42249161E+01 


Cha 


Les valeurs estimées des coefficients B; des différentes variables sont données par les valeurs 
des ML estimate of b(). Les coefficients estimés sont les mêmes que ceux obtenus avec 


TSP. 


Cliquez sur Done. Refaites toute la procédure mais en choisissant cette fois Probit au lieu 
de Logit dans la fenêtre Discrete dependent variable. Vous obtenez les résultats suivants : 


Probit model: 
Dependent variable: 
Y = ENGRAIS 


Characteristics: 

ENGRAIS 
First observation = 1 
Last observation = 398 
Number of usable observations: 
Minim value: 0.0000000E+000 
Maxim value: 1.0000000Ë+000 
Sample mean: 3.9949749E-001 


398 


This variable is à zero-one dummy variable. 
À Probit or Logit model is suitable. 


X variables: 
X(1) = EXPERT 
X(2) = DISTANCE 
X(3) = IRRIG 
X(4) = DETTE 
X(5) = PROPR 
X(6) = 1 


Frequency of y = 1:39.95 % 
Frequency of y = 0:60.05 % 


Model: P(Y=1}]x) = F(b(1)x(1)+..+b(6)x(6)) 


Chosen option: F(u) = c.d.f. of 


(0,1) distr. (Probit model) 


Newton iteration succesfully completed after 6 iterations 


Last absolute parameter change = 
Last percentage change of the li 


0.0000 
elihood = 0.0000 


Maximum likelihood estimation results: 


Variable M 
X(1)=EXPERT b 


x(2)=DISTANCE b 


X(3)=IRRIG b 


L'estimate of b(.) (t-value) 
(1)= 0.0162802 (1.85) 
[p-value = 0.06376] 
(2)= -0.0122180 (-1.00) 
[p-value = 0.31693] 
(3)= 1.1677607 (8.15) 
[p-value = 0.000001] 
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EXERCICE 3 


x(4)=DETTE b(4)= 0.0001536 (2.12) 
[p-value = 0.03441] 
X(5)=PROPR b(5)=  0.3089698 (2.12) 
[p-value = 0.03413] 
x(6)=1 b(6)= -1.0503782 (-7.42) 


[p-value = 0.000007] 
[The two-sided p-values are based on the normal approximation] 


Log likelihood: -2.14893153349F+002 
Sample size (n): 398 


If the model is correctly specified then the maximum likelihood 
parameter estimators b(1),.., b(6), minus their true values, times the 
square root of the sample size n, are (asymptotically) jointly normally 
distributed with zero mean vector and variance matrix: 

3.06929185E- 2.19694628E-03 -6.18845251E-02 -2.88036261E-05 -5.07177648E-02 
-2.78266609E- 
2.19694628E- 
-3.11861222E- 
-6.18845251E- 
-4.79552208E+ 
-2.88036261E- 
-6.76957123E- 
-5.07177648E- 
-3.51616503E+ 
-2.78266609E- 
7.97943435E+0 


5.93194461E-02 6.22160725E-02 -3.23305403E-05 -6.51424731E-02 


6.221607/25E-02 8.17/7/723437E+00 -3.90437779E-04 6.54847927E-01 


-3.23305403E-05 -3.90437779E-04 2.09877359E-06 6.65/10191E-04 


-6.51424731E-02 6.54847927E-01 6.65710191E-04 8.46501714E+00 


-3.11861222E-01 -4.79552208E+00 -6.76957123E-04 -3.51616503E+00 
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MODÉLISATION DU TAUX DE CHANGE 
ENTRE LA LIVRE STERLING ET LE DOLLAR 


Énoncé 


Le fichier UKL.XLS réunit 3 897 observations quotidiennes successives du taux de change 
entre la livre sterling et le dollar. Il s’agit d’une feuille de calcul Excel créée de manière que 
TSP puisse la lire. Elle est placée dans le dossier C:\. Dans ce fichier, la série de taux de 
change est appelée UKL. Vérifiez si le marché des changes s’est avéré efficient pour ce taux 
de change, et si celui-ci montre une volatilité conditionnelle autorégressive. Travaillez 
avec TSP. 


Vérifier l'efficience du marché 


Si le marché a l'efficience d’utiliser à tout moment l’ensemble de information disponible 
pour former le taux de change, la variation de ce dernier d’une période à l’autre ne 
devrait résulter que d’un flux d’information nouvelle, imprévisible durant les périodes 
précédentes. La variation du taux de change ne devrait donc pas être liée à ses valeurs 
passées ; elle ne devrait pas être autocorrélée. 


Il est intéressant de vérifier cela en regardant l’autocorrélogramme empirique simple de 
la variation du taux de change. Pour cela, on fait appel au programme TSP suivant : 
freq n; 

smpl 1 3898; 
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read(file=‘c:\uk1.x1s’); 
smpl 2 3898; 
duk1=uk1-uk1(-1); 
bjident(nlag=12) dukl; 


Cha 


On génère la variable duk1, qui est la variation du taux de change uk1. La commande 
bjident permet d'obtenir l’autocorrélogramme simple pour cette série dexch. Les résul- 


tats sont les suivants : 


Box-Jenkins procedures 
Procedure  BUJIDENT 


Q 


PTIONS FOR THIS ROUTINE 


TAC = FALSE NDIFF =0 NLAG = 12 
NLAGP = 10 NSDIFF = 0 NSPAN = 0 
PACMETH = BURG PLOT = TRUE PLOTAC = TRUE 
PLTRAW = FALSE SILENT = FALSE 


Autocorrelations 


Series: DUKL 
Mean = -0.7/74416330F-06 
Std. Error = 0.37493810E-02 


Lags 

Autocorrelations -0.215E-01 0.108E-01-0.128E-01 
Standard Errors 1:15 0.160F-01 0.160F-01 0.160E-01 
Q-statistics 1.80 2525 2.89 
Autocorrelations -0.341E-01-0.129F-01-0.482E-02 
Standard Errors 6-10 0.161F-01 0.161F-01 0.161E-01 
Q-statistics 1358 1339 14.0 
Autocorrelations -0.2TZ4EÉ-01-0:173E-0 
Standard Errors 11-12 0.161E-01 0.161E-0 
Q-statistics 21.5 22.6 

Partial Autocorrelations 


Series: DUKL 
Standard Error of Autocorrelations = 0.16018978E-01 


Lags 
Partial Autocorrs 1- 5 -0.215E-01 0.103E-01-0.124E-01 
Partial Autocorrs 6-10 -0.338E-01-0.142E-01-0.484E-02 


Autocorrelation Function of:  DUKL 


0.288E-01 0.259E-01 
0.160E-01 0.160E-01 
6.14 8.75 
0.141E-01 0.351E-01 
0.161E-01 0.161E-01 
14.8 19.6 


0.282E-01 0.274E-01 
0.119E-01 0.368E-01 
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-1.00 -0.60 -0.20 0.20 0.60 1.00 
-+------- +--------- +----- O----+--------- +--------- +- 
1 R|+ -0.021479 
2 +R+ 0.010753 
3 +R+ -0.012811 
4 +R 0.028838 
5 +R 0.025880 
6 R|+ -0.034112 
7 +R+ -0.012878 
8 +R+ -0.0048205 
9 +R+ 0.014079 
10 +R 0.035085 
11 R|+ -0.021683 
12 +R+ -0.017293 
EE EE O----+--------- +--------- +- 
-1.00 -0.60 -0.20 0.20 0.60 1.00 
Partial Autocorrelation Function of DUKE 
-1.00 -0.60 -0.20 0.20 0.60 1.00 
D EE EE O----+--------- +--------- +- 
1 R|+ -0.021481 
2 +R+ 0.010297 
3 +R+ -0.012370 
4 +R 0.028219 
ss +R 0.027388 
6 R|+ -0.033813 
7 +R+ -0.014201 
8 +R+ -0.0048384 
9 +R+ 0.011873 
10 +R 0.036836 
-+--------- +--------- +----- O----+--------- +--------- +- 
-1.00 -0.60 -0.20 0.20 0.60 1.00 


La variation duk1 de uk1 n’est pas autocorrélée ; cela confirme l’efficience du marché des 
changes. Graphiquement, les coefficients d’autocorrélation empiriques sont à l’intérieur 
de lintervalle dans lequel on ne rejette pas l'hypothèse que les coefficients d’autocorréla- 
tion de population sont nuls. Les tests Q sont inférieurs à leurs valeurs critiques respectives 
à 5%. 


Vérifier le caractère autorégressif de la volatilité 


Le fait que le niveau de la variation du taux de change ne dépende pas des niveaux 
précédents n'empêche pas la variance du taux de change de dépendre des variances 
précédentes. Autrement dit, même avec un niveau de taux de change non autocorrélé, la 
variance du taux de change peut être autocorrélée. La variance V(X;) d’une variable X; 
est égale à E ( (X; — E(X:))2. Dans cette application, X; est égal à DUKL;, dont la moyenne 
est presque nulle, ce qui suggère que E(DUKL,) — 0. Dès lors, V(DUKL,) — E(DUKL}). 
Vérifier que V(DUKL,) est autocorrélé revient à vérifier que E(DUKL?) est autocorrélé. 
On n’observe pas E(DUKL?), mais bien DUKL? à chaque période. Il suffit donc de vérifier 
que DUKL? est autocorrélé en regardant l’autocorrélogramme empirique simple du carré 
de la variation du taux de change. 
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Pour cela, on utilise le programme TSP suivant : 


freq n; 

smpl 1 3898; 
read(file=‘c:\ukl1.x1s’); 
smpl 2 3898; 
duk1=uk1-uk1(-1); 
duk12=duk1**?; 
bjident(nlag=12) duk1?; 


Les résultats sont : 


Box-Jenkins procedures 
Procedure BUIDENT 


OPTIONS FOR THIS ROUTINE 


IAC = FALSE NDIFF = 0 NLAG = 12 

NLAGP = 10 NSDIFF = 0 NSPAN = 0 

PLOT = TRUE PLOTAC = TRUE PLTRAW = FALSE 

Autocorrelations 
0 0 O0 
Series (1-B) (1-B ) DEXCH2 
Mean = 0./75927506E-03 
Standard Error = 0.15345252E-02 
Lags 

Autocorrelations 0./732E-01 0.528E-01 0.151 0.129 0.244E-01 
Standard Errors LE 5 0.462E-01 0.464F-01 0.466E-01 0.476E-01 0.483E-01 
Q-statistics 2.53 3:69 14.7 22.6 22.8 
Autocorrelations -0.142E-01 0.546E-01 0.212E-01 0.657E-01 0.192E-01 
Standard Errors 6-10 0.483E-01 0.484F-01 0.485E-01 0.485E-01 0.487E-01 
Q-statistics 22.9 24.4 24.6 26.6 26.8 
Autocorrelations 0.126 0.211E-0 

Standard Errors 11-12 0.487E-01 0.494E-0 
Q-statistics 34.4 34.6 

0 0 0 

Autocorrelation Function of the series (1-B) (1-B ) DEXCH2 
-1.00 -0.60 -0.20 0.20 0.60 1.00 
libssssassss Hssisentes see Dites pese ns ée +- 

1 | +R | 0.073215 
2 | [R | 0.052828 
8 | | R | 0.15116 
4 | | +R | 0.12874 
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5 R 0.024414 
6 +R + -0.014198 
7 R 0.054626 
8 + [R+ 0.021222 
9 +R 0.065693 
10 +R + 0.019191 
11 + | +R 0::12555 
12 + Î[R+ 0.021133 

CARS RE I free CÉRRSCECE. RARE EE + 

1.00 0.60 0.20 0.20 0.60 1.00 


L'autocorrélation de duk12 suggère que duk12 est autocorrélé et donc que duk1 est un 
processus de type ARCH ou GARCH. On vérifie plus rigoureusement l’existence d’un tel 
effet ARCH dans le processus de DEXCH au moyen d’un test formel. Pour cela, on exécute 
le programme suivant : 


freq n; 
smpl 1 3898: 
read(file=*uk1.x1s?); 
smpl 2 3898; 
duk1=uk1-uk1(-1); 
duk12=duk1**x2; 

smpl 12 3898; 
noplots; 
olsq duk12 c duk12(-1)- duk12(-10); 
const Im; 

set Im=@rsq*@nob; 

print Im; 


L'instruction o1sq réalise l'estimation par MCO d’un modèle linéaire où la variable 
dépendante est duk12 et les variables explicatives sont à peu près les dix premières valeurs 
retardées de duk12 et une constante. L'instruction suivante définit un paramètre 1m 
comme une constante. L'instruction set affecte la valeur de cette constante. TSP utilise 
la notation @rsq pour appeler le R? des résidus de la régression précédente estimée par 
MCO. Le terme @nob correspond à l'effectif des observations sur lesquelles cette régression 
a été estimée. Les résultats sont les suivants : 


Equation 1 


Method of estimation = Ordinary Least Squares 


Dependent variable:  DUKL2 
Current sample: 12 to 3898 
Number of observations: 3887 


Mean of dep. var. = .140807E-04 

Std. dev. of dep. var. = .340999F-04 
Sum of squared residuals = .431192E-05 
Variance of residuals = .111247E-08 
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Std. error of 


Adjust 


D 
Dur 
Jarq 


R-squared 
ed R-squared 
LM het. test 
urbin-Watson 
bin’s h alt. 


Ramsey’s RESET2 


AS 
Sc 
Lo 


V 

DUKL2(-1 
DUKL2(-2 
DUKL2(-3 
DUKL2(-4 
DUKL2(-5 
DUKL2(-6 
DUKL2(-7 
DUKL2(-8 
DUKL2(-9 
DUKL2(-10) 


LM = 177.839 


zero slopes) 
hwarz B.I.C. 
g likelihood 


Estimated 
Coefficient 
./58102E-05 


8668 
-.140970E-02 
-.216749E-02 
.07852 
.03991 


53 


regression = 


ue-Bera test = 


.333536E-04 


.045752 
.043290 


66.3115 [.000] 
2.00515 C<.663] 
-4.02320 [C.000] 
.105864E+07 C.000] 
16.4058 [C.000] 
18.5839 [.000] 


-34513.2 
34558.6 


Standard 
Error 
./47847E-06 
.016049 
.016052 
.016091 
.016097 
.016056 
.016056 
.016097 
.016091 
.016052 
.016050 


t-statistic 
10:1371 
5.031722 
4.31301 
1.747205 
2.99018 
2.10591 
5.39883 
-.087573 
-.134702 
4.89150 
2.48671 


Ù 
0 
OO < 
D 
© — 
1e 
D 


[.081] 


[.035] 


LO 
(où) 


[.893] 
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Pour tester l’hypothèse d'absence d’effet ARCH, il suffit de mettre la valeur du test LM en 
regard de la valeur critique d’une loi Chi-2 à 10 degrés de liberté. Selon cette hypothèse, | 
duk12 ne dépend pas de ses valeurs passées. Cela implique que la volatilité nest pas 
autorégressive. Ici, le test vaut 177.83953, soit un résultat supérieur à la valeur critique 
18.3070. On rejette donc l'hypothèse que tous les coefficients des duk12(-1i) sont nuls: 
on est bien en présence d’un effet ARCH. 


On peut vérifier que duk12 suit un processus ARMA en estimant un modèle ARMA(1, 1) 


pour duk12: 


freq n; 
smpl 1 3898; 


read(file=‘c:\uk1.x1s’); 


smpl 2 3898; 


duk1=uk1-uk1(-1); 


duk12=duk1*%x2; 


bjest(nar=1,nma=l,constant ,noplot,nocumplo) duk12 start phi(1) 


Ce programme donne les résultats suivants : 


Box-Jenkins pr 
Procedure BJ 


ocedures 
EST 
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.921 theta(l) . 


DT 
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Working space used: 47367 


STARTING VALUES 


PHI1 THETA CONSTANT 
VALUE 0.92100 0.87100 1.30702D-06 
F=  -34639. FNEW= -34650. SQZ=. 1 -STÉP=.0.:25 
F=  -34650. FNEW= -34652. SQZ= _0:-STEP= «1: 0 
F=  -34652. FNEW=  -34663. SQZ= O0 STEP= 1.0 
F=  -34663. FNEW=  -34663. SQZ= O0 STEP= 1.0 
F=  -34663. FNEW= -34663. SQZ= O0 STEP= 1.0 
F=  -34663. FNEW= -34663. SQZ= O0 STEP= 1.0 
CONVERGENCE ACHIEVED AFTER 6 ITERATIONS 
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Dependent variable: DUKL2 
Current sample: 2 to 389 
Number of observations: 


Mean of dep. var. = 


Std. dev. of dep. var. 
Sum of squared residuals 
Variance of residuals 
Std. error of regression 


R-squared 
Parameter Estimate 
PHII .986099 
THETAI .947381 
CONSTANT .193660E-06 


Standard Errors computed 
derivatives (Gauss) 


000 CRIT- 39.047 
000 CRIT= 22.165 
000 CRIT= 21.513 
000 CRIT= 0.28527 
000 CRIT= 0.90534E-02 
000 CRIT= 0.60963E-03 


Results of Box-Jenkins Estimation 


8 
3897 


Stan 

EF 
.454 
.873 
.696 


from 


.140543E-04 Adjusted R-squared = 
.340606E-04 
= .4 
= ,1 
= ,3 
= .0 


LM het. 
Durbin-Wa 
Schwarz B. 
Log likeli 


28896E-05 
10143E-08 
318/8E-04 
51084 


dard 

ror t-statistic 
929E-02 216.759 
916E-02 108.406 
202E-07 2.178166 


quadratic form of analy 


Autocorrelations of the Residua 


1 
Autocorr 0.026178 
Q-stat 2.67265 
P-value 

5 
Autocorr -0.010011 
Q-stat 5.21568 
P-value 0.15667 

9 
Autocorr 0.029808 
Q-stat 28.70552 
P-value 0.00016371 


0 
3 


0 
1 
0 


0.0 
2 
0.0 


2 3 
.016287 -0.016528 
.70752 4.77345 

0.028902 

6 
.040464 -0.040680 
1.60957 18.07353 
.020503 0.0028557 0. 

10 11 
0013981 0.027821 
8./0560 31:73197 
0035711 0.00022152 0. 


.050596 
test = 42.0314 [.000] 
tson = 1.94763 
I.C. = -34650.5 
hood = 34662.9 


P-value 
[.000] 
.000] 
.005] 


tic first 


un 


0.0036132 


.042808 


© © © 
Cu 
D 
[9] 
[9] 
ee 
= 


© &w © 
D 
al 
LS 
= 
[ex] 
D 


0032476 
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Il faut donc utiliser Pinstruction ARCH pour estimer un modèle GARCH. La valeur de 
nar correspond à la valeur de p, et celle de nma à celle de g: 


EZINIT = HINIT 
HINIT = SSR 
NMA St 
ZERO = TRUE 


Working space used: 5492 


= 
> 
= 
= 
m1 
1 
SJ 
= 
= 
[ex] 
Co 
[= 
1 
[= 
SJ 


F= -16240. PF 
F= -16261. PF 
F= -16391. PF 
F= -16440. F 
F= -16463. PF 
F= -16471. EF 
F= -16473.  F 
F= -16473. PF 
F= -16473. PF 


PO OT 0 O0 OI 0 Om mm mm 


CONVERGENCE ACHIEVED AFTER 9 ITERATIONS 
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Dependent variable: DUKL 
Current sample: 2 to 38 
Number of observations: 


OP 


Equation 2 


GARCH ESTIMATION 


TIONS FOR THIS ROUTINE 


GT _ 
MEAN = FALSE 
RELAX = FALSE 


5 


0. 


6261. 
6391. 
6440. 
6463. 
6471. 
6473. 
6473. 
6473. 
6473. 


NS. 


98 
389 


HEX 
NAR 
UNC 


STARTING VALUES 


ALPHAO 
000014054 


SQZ= 
SQZ= 
SQZ= 
SQZ= 
SQZ= 
SQZ= 
SQZ= 
SQZ= 
SQZ= 


7 


(Statistics based on transformed data) 


Mean of dep. var. 

Std. dev. of dep. var. 
Sum of squared residuals 
Variance of residuals 
Std. error of regression 
R-squared 

Adjusted R-squared 
Durbin-Watson 
Jarque-Bera test 


= -.458069E-04 


= .33/7224E-02 


.044307 

.113724E-04 
.337230E-02 
.477087E-02 
.477087E-02 
= 2.02142 [<1.00] 


D::0;:S:0:S'%: NN .@. © 


= 861.453 [.0001 


(Statistics based on original data) 


Mean of dep. var. 
Std. dev. of dep. var. 
Sum of squared residuals 
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= -./44163E-06 


3/74938E-02 
054786 


UM UE EC CE EC EC EC CA 
JA Cp RAS) AN Et 


0. 


ALP 
00 


HA 
000 


P 


OND 


. 0000 
. 0000 


. 25000 
.12500 


. 0000 
. 0000 
. 0000 
. 0000 
.0000 


= 0.50000 
si 
FALSE 


BETA 
0.00000 


ED: CD 20 CD O0 LCD: D 
D DID DID UD 
Il 


30.959 


7 


.971 


195.69 
301.39 


2 
2 
0. 


0.89389E-03 
0.47975E-07 


.483 


.6573 


5301 
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Variance of residuals = .140622E-04 

Std. error of regression = .3/74995FE-02 

R-squared = .954909E-03 

Adjusted R-squared = .954909FE-03 
Durbin-Watson = 2.04213 


Schwarz B.I.C. = -16456.5 
Log likelihood = 16473.0 
Number of observations in LogLl = 3897 
Initial observations dropped = 0 
Est. initial values for H(t) = 0 
Initial values for H(t) = 0.14059E-04 
Standard 
Parameter Estimate Error t-statistic P-value 
C -.662670E-04 .550785E-04 -1.20314 [.229] 
ALPHAO .163120E-06 .733031E-07 2.22528 [.026] 
ALPHAI .040517 .962832E-02 4.20813 [.000] 
BETA .947803 .013215 11:7222 [.000] 


Standard Errors computed from analytic first and second derivatives 
(Eicker-White) 


EXERCICE À MODÉLISATION DU TAUX DE CHANGE AVEC EASYREG 


Énoncé 


Estimez un modèle GARCH(1, 1) pour la variation du taux de change entre la livre sterling 
et le dollar, en utilisant Easyreg et les données du fichier UKL.XLS précédent. 


Voici comment procéder : 


Lecture des données 


Ouvrez le fichier UKL.XLS sous Excel, cliquez sur Fichier puis sur Enregistrer sous, et 
sélectionnez CSV (séparateur point-virgule) comme type de fichier. Laissez Disque local 
C:\ dans la zone Enregistrer dans et conservez UKL comme nom du fichier. Cliquez sur 
Enregistrer. Le logiciel crée un fichier UKL.csv dans C:\. Ouvrez Easyreg et cliquez suc- 
cessivement sur File/Choose an input file/Choose an Excel file in CSV format. 


Dans la fenêtre Guided tour qui apparaît, cliquez sur la réponse de votre choix; si vous 
demandez le Guided tour, il faut ensuite réduire la fenêtre Guided tour on importing Excel 
files in CSV format pour pouvoir continuer à travailler avec Easyreg (et voir la fenêtre 
About CSV files). Dans la fenêtre About CSV files, cliquez sur Continue. La fenêtre Find 
a CSV file s'ouvre : sélectionnez Manually dans Search options, C: dans Choose drive, 
et C:\ dans Choose drive/directory. Cochez Double-click to choose file and continue. 
Double-cliquez sur C:\ UKL.csv dans Files found. Data type of the CSV file s'affiche. 
Cochez Annual time series, même si les données sont journalières. Saisissez 1 dans Year 
of first observation et cliquez sur OK. Ensuite cliquez sur Confirm, puis sur Continue. 
Analyzing the CSV file s'affiche. Cliquez sur Code OK. 


Lorsque les fenêtres suivantes apparaissent, cliquez sur Continue : Data written to files; 
Check the data ; About the start-up folder EASYREG.DAT. Maintenant, Choose drive and 
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folder to start-up EasyReg apparaît. Sélectionnez C:\. Ensuite saisissez EXCHANGEL dans 
Make a new sub-folder in the Current folder — Enter the folder name et cliquez sur OK. 
Cliquez sur Start Easyreg in current folder. 


Transformation des données 


Cliquez successivement sur Menu/Input/Transform variables. L'écran Transformation of 
variables s'affiche. Cliquez sur Time series transformations puis sur Difference : x(f) — 
x(f — m). Le logiciel affiche m = 1. Cliquez de nouveau sur Difference : x(f) — x(f — m), 
sur Continue et sur OK. Enfin, cliquez sur Done. Le logiciel a créé une nouvelle variable 
DIFI[UKL]. 


Estimation du modèle 


Cliquez sur Menu, sur Single equation models puis sur Linear regression models. Dans la 
fenêtre Guided tour qui apparaît, cliquez sur la réponse de votre choix ; si vous demandez 
le Guided tour, il faut ensuite réduire la fenêtre Guided tour on ordinary least squeres 
estimation and extensions pour pouvoir continuer à travailler avec Easyreg. Dans la fenêtre 
Select all variables in your linear regression model, double-cliquez sur DIFI[UKL] puis 
cliquez sur Selection OK. 


Dans la fenêtre Selected variables for OLS estimation, cliquez sur NO en réponse 
à la question « Do you want to use a subset of observations ». Ensuite cliquez sur 
Continue et de nouveau sur Continue. Dans la fenêtre Select the independent (X) 
variables, ne sélectionnez aucune variable et cliquez simplement sur Selection OK. Dans 
la fenêtre Select laggeg dependent Y variables as X variables, cliquez sur Skip all. Dans la 
fenêtre Select deterministic X variables, cliquez sur Continue. Dans la fenêtre suivante, 
le logiciel affiche q = 0. Cliquez sur q OK puis sur Continue. Dans la fenêtre Model 
variables, cliquez sur Continue. Les résultats de la régression de la variation du taux de 
change sur une constante apparaissent : 


Dependent variable: 
Y = DIFIL[UKL] 


Characteristics: 


DIFIL[UKL] 
First observation = 2 
Last observation = 3898 


Number of usable observations: 3897 
Minimum value: -2.5300000E-002 
Maximum value: 2.3500000E-002 
Sample mean: -/7.4416218E-007 


X variables: 
X(1) = I 


Model: 

Y = b(1)X(1) + U, 

where U is the error term, satisfying 
E[UIX(1)] = 0. 
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OLS estimation results 


Parameters Estimate t-value H. 
b(1) 0.00000 -0.012 
[0.990111] 


Effective sample size (n) 3897 


Standard error of the residuals = 0. 


Variance of the residuals = 0.000014 


C. t-value(*) 


[p-value] [H.C. p-value] 


-0.012 
[0.990111] 


*) Based on White’s heteroskedasticity consistent variance matrix. 
[The two-sided p-values are based on the normal approximation] 


003749 


Residual sum of squares (RSS)= 0.054 


R-square = 0.000000 
Adjusted R-square = 0.000000 


The Durbin-Watson test requires an i 


1769 


Total sum of squares (TSS) = 0.054769 


ntercept 


and at least one other X variable, and is 


therefore not reported. 


Jarque-Bera/Salmon-Kiefer test = 2440.716711 
Null hypothesis: The errors are normally distributed 


Null distribution: Chi-square(2)) 

p-value = 0.00000 

Significance levels: 10 % 5 
Critical values: 4.6 5:99 
Conclusions: reject reject 

The Breusch-Pagan test requires an intercept 
and at least one other X variable, and is 
therefore not reported. 


Information criteria: 


Akaike: -1.11718E+01 
Hannan-Quinn: -1.117/12E+01 
Schwarz: -1.11681E+01 


Cliquez sur Continue. Dans l’écran Model type : OLS : what to do next?, cliquez sur 
Options et puis sur Re-estimate the model with GARCH errors. Dans l’écran GARCH 
1) et sur r(2, 1). La valeur maximale de ; 
reprise pour les coefficients r(1, 5) est égale à g et la valeur maximale de l reprise pour les 
de r(1,1) et r(2, 1), fixez g = 1 et p = 1. 
Dans l'écran Simplex iteration, cliquez sur start SIMPLEX iteration. Le logiciel affiche 
les valeurs estimées des coefficients dans Parameter Values. Vous pouvez cliquer ensuite 
ffiche alors les nouvelles valeurs estimées 
des coefficients. Faites cela plusieurs fois successivement jusqu’à ce que les valeurs des 
paramètres ne changent plus. Cliquez sur Done with SIMPLEX iteration. Ensuite cliquez 


error structure specification, cliquez sur r(1, 


coefficients r(2, 1) est égale à p. En repartant 


sur restart SIMPLEX iteration. Le logiciel a 


sur Continue. 
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Les résultats de l'estimation s'affichent : 


Dependent variable: 
Y = DIFI[UKL] 


Characteristics: 
DIFICUKL] 

First observation = 2 

Last observation = 3898 

Number of usable observations: 3897 
Minimum value: -2.5300000E-002 
Maximum value: 2.3500000E-002 
Sample mean: -/7.4416218E-007 


X variables: 
X(1) = 1 


odel: 

Y = b(I)X(1) + U, 

where U is the error term, satisfying 
ECUIX(1)] = 0. 


OLS estimation results 


Parameters Estimate t-value H.C. t-value(*x) 

[p-valuel [H.C. p-value] 
b(1) 0.00000 -0.012 -0.012 

[0.990111] [0.990111] 


(*) Based on White’s heteroskedasticity consistent variance matrix. 
[The two-sided p-values are based on the normal approximation] 
Effective sample size (n) = 3897 
Variance of the residuals = 0.000014 
Standard error of the residuals = 0.003749 
Residual sum of squares (RSS)= 0.054769 
Total sum of squares (TSS) = 0.054769 
R-square = 0.000000 

Adjusted R-square = 0.000000 


The Durbin-Watson test requires an intercept 
and at least one other X variable, and is 
therefore not reported. 


Jarque-Bera/Salmon-Kiefer test = 2440.716711 

Null hypothesis: The errors are normally distributed 
Null distribution: Chi-square(2)) 

p-value = 0.00000 


Significance levels: 10 # 5 % 
Critical values: 4.61 5.99 
Conclusions: reject reject 


The Breusch-Pagan test requires an intercept 
and at least one other X variable, and is 
therefore not reported. 
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Information criteria: 


Akaike: -1.11/718E+01 
Hannan-Quinn: -1.11712E+01 
Schwarz: -1.11681E+01 


Model type: OLS with GARCH errors 

Error specification: 

ET = ROLALIVCE) = + CÉZANNE TIUCE) #2; 

where u(t) îs the error of the OLS conditional expectation model, 
VCE) is its conditional variance, 

d is a constant, and L is the lag operator. 

ATT the parameters should be non-negative. 

However, only the restrictions V(t) > 0 will be imposed. 


Model type: OLS with GARCH errors 


Error specification: 

C1 - r(1,1)LIV(E) = d + [r(2,1)LIu(t)12, 

where u(t) îs the error of the OLS conditional expectation model, 
VCE) is its conditional variance, 

d is a constant, and L is the lag operator. 

ATT the parameters should be non-negative. 

However, only the restrictions V(t) > 0 will be imposed. 


The likelihood has been maximized using the simplex method of 
elder and Mead. 
The algorithm involved is a Visual Basic translation of the 
Fortran algorithm involved in: 

.H.Press, B.P.Flannery, S.A.Teukolsky and W.T.Vetterling, 
‘Numerical Recipes’, Cambridge University Press, 1986, 


pp. 292-293 

aximum likelihood estimation results: 

Parameters ML estimate t-value [p-value] 

b(1 -0.000094 -1.925 [0.05423] 

d 0.000000 7.124[0.00000] 
r(1,1) 0.894137 239.688 [0.000001] 
r(2,1) 0.072464 20.950 [0.000001] 


[The two-sided p-values are based on the normal approximation] 


RSS = 54.803603120E-03 
s.e. = 37.519958939F-04 
R-square = -0.0006 

n = 3897 


If the model is correctly specified, in the sense that the conditional 
expectation of the error e(t) relative to the X variables and all 
lagged dependent (Y) variables and lagged X variables equals zero, then 
the OLS-GARCH parameter estimators minus their true values, times the 
square root of the sample size n, are (asymptotically) jointly normally 
distributed with zero mean vector and variance matrix : 
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9.3/7509912E-06 -4.23373/68E-09 3.55517/980E-04 -2.17/7479503E-04 
-4.23373/768E-09 1.65900830E-11 -5.98/748517E-07 -1.46021836E-0/7 
3.55517/980E-04 -5.98748517E-07 5.42306258E-02 -2.78703020E-02 
-2.17479503E-04 -1.46021836E-07 -2.78703020E-02 4.6624158/E-02 


Le coefficient r(1, 1) correspond à B:, le coefficient d à & et le coefficient r(2, 1) à ou. 
Les valeurs obtenues pour les coefficients estimés sont un peu différentes des valeurs 
estimées obtenues avec TSP. Même si vous utilisez des valeurs de départ égales aux 
valeurs estimées obtenues avec TSP, cela ne change rien aux résultats obtenus avec Easyreg. 
La raison de cette disparité : les deux logiciels utilisent des algorithmes d’optimisation 
différents. Les résultats sont toutefois qualitativement similaires et l’ordre de grandeur 
des coefficients estimés est très proche. 
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Index 


A 


ANOVA : 87 
Approximation 
conditionnelle : 27 
linéaire : 26, 27 
Autocorrélation : 84, 151 
du terme d’erreur : 29, 35, 41 
Autocorrélogramme : 8 
partiel : 155, 156 
simple : 155, 156 
théorique : 151 
Autocovariance : 151 


Borne de Rao Cramer : 80 
Bruit blanc : 8, 28, 35, 39, 77, 78, 152, 159 


[e 


Coefficient 

d’autocorrélation : 8, 172 

de corrélation empirique : 32 
Cointégration : 161, 203, 205, 208 
Cointégré, processus stochastique : 202 
Constance : 39, 43 
Constante : 24, 163, 164, 166 
Convergent, estimateur : 135 
Coupe instantanée : 5 
Critères : 164, 165, 167 


D 


Dérive : 159 
Différence première : 163 
Distribution 
asymptotique : 40, 77 
asymptotique normale : 36, 37 


conditionnelle : 33, 36, 37 
exacte : 37, 38, 40, 43 
inconditionnelle : 33, 37 
marginale : 33, 36 
normale : 135 

Doubles moindres carrés : 133, 134 


Écart type estimé : 37 
Emboîtée : 40 
Équation 
apparemment linéaire : 129 
exactement identifiée : 131 
structurelle : 130, 131, 134 
SUR : 128 
suridentifiée : 131 
Équivalentes en observation, formes 
structurelles : 131 
Estimateur 
convergent : 34, 36, 41, 84, 85 
de maximum de vraisemblance : 79, 135, 
216 
de variables instrumentales : 89 
de variance robuste : 83 
de variance robuste à l’hétéroscédasticité : 
83 
de variance robuste à l’hétéroscédasticité et 
à l’autocorrélation : 84 
des doubles moindres carrés : 133, 134 
des moindres carrés généralisés : 85 
des moindres carrés ordinaires : 30, 31, 33, 
81 
des triples moindres carrés : 134 
du maximum de vraisemblance : 40 
Fully Modified : 205, 208 
sans biais : 34, 36 
SUR : 129 
Expression cointégrée : 202, 206 


Index 
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Index 


F 


Fonction : 157 

de vraisemblance : 40, 79, 131, 172, 217 
Forme 

fonctionnelle : 3 

réduite : 130, 131 

structurelle : 130, 131 


H 


Hétéroscédasticité : 83, 84 
du terme d’erreur : 29, 35 


Identification : 129, 131, 218, 222, 223 
Identité : 130 

Indépendance : 27, 135 

Indépendant : 27, 34, 35, 37, 39 

Intégré : 159, 160, 162, 170, 201, 202, 205 
Intervalle de confiance : 86 

Inversible, modèle MA : 156 


L 


Logit : 260 


M 


Marche 
aléatoire : 159, 160 
au hasard : 159 
Matrice 
d’information : 80 
de covariance : 36 
de variance : 36 


de variance et de covariance : 208, 259, 260 


Maximum de vraisemblance : 79, 135 
Mécanisme à correction d’erreur : 10, 213 
Modèle 

VAR : 208, 210, 212 

à correction d’erreur : 205, 206 

à correction d’erreur conditionnel : 220, 

242,223 
à équations simultanées : 129 
à variables dépendantes discrètes : 258 


à volatilité conditionnelle autorégressive : 


262 
contraint : 40, 41 
dynamique général : 9 
estimé : 30 
linéaire : 24, 26, 27, 29, 39, 40, 76, 79, 86 


linéaire dynamique : 38, 39 

linéaire en coupe instantanée : 86 

Logit : 260 

Logit multinomial : 261 

non contraint : 40, 77 

Probit : 259 

statique : 8 

structurel à correction d’erreur : 223 

structurel à équations simultanées à 

correction d’erreur : 222 

Modélisation de Box et Jenkins : 170 
Moindres carrés 

généralisés : 134 

ordinaires : 29 
Multicolinéarité : 81 

parfaite : 31, 81 


N 


Nominales, données réelles : 6 

Normal, terme d’erreur : 77, 78 

Normalisation : 203, 222 

Normalisées, équations : 130 

Normalité : 37, 43 

Normaux, estimateurs des moindres carrés : 
134, 135 


O 


Opérateur de retard : 153, 157 
Orthogonale, direction vectorielle : 31 
Orthogonalité : 31 


P 


Panel : 6 
Paramètre : 3 
Partie expliquée : 30 
Perturbation : 24 
Polynôme : 153 
caractéristique : 153, 156, 159, 160 
Prévision : 86 
Probit : 260 
Processus 
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